4 ก.ค. 2023 เวลา 09:57 • วิทยาศาสตร์ & เทคโนโลยี

CPU 128-Core ใหม่ของ AMD ยกระดับประสิทธิภาพของ Cloud Data Centers

แทบไม่เคยคิดเลยว่าจะมี CPU x86 ถึง 128 Core บน SoC เดียว
Hoola
เอเอ็มดีกำลังเพิ่มเดิมพันในตลาดคลาวด์ด้วยโปรเซสเซอร์เซิร์ฟเวอร์ตระกูลใหม่ที่มีชื่อรหัสว่าแบร์กาโม สมาชิกแต่ละตัวมีคอร์ CPU สูงสุด 128 x86 ที่ยอดเยี่ยมเมื่อพูดถึงประสิทธิภาพการใช้พลังงาน
บริษัทในซานตาคลารา รัฐแคลิฟอร์เนีย กล่าวว่า แบร์กาโมมีเอกลักษณ์ตรงที่ใช้ซีพียูรุ่น Zen 4 ที่เน้นระบบคลาวด์ ซึ่งเปิดตัวในตลาดศูนย์ข้อมูลเมื่อปีที่แล้วด้วยซีพียูเจนัวที่ใช้งานทั่วไป AMD เปิดตัวตระกูล EPYC 97X4 ที่ศูนย์ข้อมูลและงานเทคโนโลยี AI ในซานฟรานซิสโก ซึ่งมีElectronic Designเข้าร่วมด้วย
ซีอีโอ Lisa Su กล่าวว่าแกน Zen 4c นั้นใช้สถาปัตยกรรมขนาดเล็กแบบเดียวกับ Zen 4 แต่ได้รับการออกแบบมาโดยเฉพาะให้มีขนาดกะทัดรัดและประหยัดพลังงานมากกว่าแกนหลัก Zen 4 ซึ่งบริษัทมุ่งเน้นที่การเพิ่มประสิทธิภาพต่อคอร์แทน ตามข้อมูลของ AMD ประสิทธิภาพการใช้พลังงานที่ดีขึ้นถึง 2.7 เท่าและช่วยให้สามารถบรรจุคอนเทนเนอร์ต่อเซิร์ฟเวอร์ได้มากถึง 3 เท่าเมื่อเทียบกับซิลิคอนของคู่แข่ง
ด้วยการติดตามเส้นทางใหม่ในการออกแบบแกน CPU บริษัทกล่าวว่าสามารถรวมแกน CPU ได้สูงสุด 128 แกนต่อชิป Bergamo ในขณะที่ CPU เซิร์ฟเวอร์ Genoa ที่มีจำหน่ายมีขีดจำกัด 96 แกน
"จุดออกแบบที่เหมาะสมที่สุดสำหรับโปรเซสเซอร์เหล่านี้แตกต่างจากการประมวลผลแบบใช้งานทั่วไป" ซูกล่าว พร้อมเสริมว่าปัจจุบันแบร์กาโมกำลังจัดส่งให้กับลูกค้าไฮเปอร์สเกล รวมถึง Meta และได้รับประโยชน์จากความหนาแน่นสูงสุดและประสิทธิภาพการใช้พลังงานที่ดีที่สุด"
ใช้กับคลาวด์
ด้วย EPYC ของแบร์กาโม AMD กำลังมองหาการสร้างโอกาสที่เพิ่มขึ้นในศูนย์ข้อมูลคลาวด์
“ผู้ให้บริการระบบคลาวด์รายใหญ่ทุกรายได้ปรับใช้ EPYC สำหรับอินสแตนซ์ภายในและอินสแตนซ์ที่ลูกค้าเผชิญ” ซูกล่าว รวมถึงผู้ให้บริการคลาวด์สาธารณะที่โดดเด่นที่สุดในสหรัฐฯ อย่าง Amazon, Google และ Microsoft
CEO Lisa Su แสดง CPU ของ Bergamo ในระหว่างการกล่าวสุนทรพจน์ที่ศูนย์ข้อมูลและเทคโนโลยี AI ของ AMD
ชัยชนะของเอเอ็มดีกำลังทำลายการครอบงำของตลาดศูนย์ข้อมูลของอินเทล ซึ่งซีพียูตัวเดียวอาจมีราคาสูงกว่า 10,000 ดอลลาร์ การฟื้นฟูของบริษัทได้รับพลังจากสถาปัตยกรรม Zen CPU ที่เปิดตัวในปี 2560
แต่เนื่องจากยักษ์ใหญ่ด้านคลาวด์คอมพิวติ้งเป็นหนึ่งในผู้ซื้อซิลิกอนเซิร์ฟเวอร์ที่อุดมสมบูรณ์ที่สุด จึงสมเหตุสมผลที่บริษัทจะปรับแต่งชิปในระดับพื้นฐานมากขึ้นตามความต้องการเฉพาะ
เอเอ็มดีกล่าวว่าแบร์กาโมถูกสร้างขึ้นมาโดยเฉพาะสำหรับปริมาณงาน "เกิดในระบบคลาวด์" โดยอิงจากไมโครเซอร์วิส โดยแบ่งออกเป็นส่วนย่อยๆ ของโค้ดที่รันในซีพียู "เสมือน" ที่แยกจากกันซึ่งใช้ซีพียูจริงเพียงตัวเดียว (รูปที่1 ) คอร์ CPU ขนาดใหญ่ที่มาพร้อมกับแคชจำนวนมากมักจะไม่เหมาะที่สุดสำหรับเวิร์กโหลดประเภทนี้
ผู้ให้บริการคลาวด์ให้เช่าพลังการประมวลผลในศูนย์ข้อมูลของตนแบบคอร์ต่อคอร์ ผลที่ตามมาคือ แกน CPU ที่มากขึ้นหมายความว่าพวกเขาสามารถเรียกใช้เครื่องเสมือนและคอนเทนเนอร์ได้มากขึ้นในกล่องฮาร์ดแวร์เดียวในศูนย์ข้อมูล ดังนั้นจึงสามารถหมุนเวียนปริมาณงานจำนวนมากขึ้นพร้อมกันได้
ประสิทธิภาพการใช้พลังงานเป็นชื่ออื่นของเกมกับผู้นำในตลาดคลาวด์ ค่าไฟฟ้าเป็นหนึ่งในค่าใช้จ่ายต่อเนื่องที่ใหญ่ที่สุด ซึ่งส่งผลต่อต้นทุนรวมในการเป็นเจ้าของ (TCO) ของศูนย์ข้อมูลและเป้าหมายด้านความยั่งยืน
ด้วยการใช้ประโยชน์จากคอร์ Zen 4c เอเอ็มดีระบุว่าแบร์กาโมสามารถรวมคอร์ได้สูงสุด 128 คอร์ โดยมีเธรดสูงสุด 256 เธรดเมื่อใช้มัลติเธรดพร้อมกัน (SMT) ด้วยความเร็วพื้นฐานที่ 2.25 GHz
เมื่อมองไปข้างหน้า แบร์กาโมจะต้องแข่งขันกับการออกแบบชิปอื่นๆ ที่เน้นระบบคลาวด์ ตั้งแต่ซีพียูที่รองรับ Arm ของ Ampere ซึ่งจะมีแกนประมวลผลสูงสุด 192 คอร์ ไปจนถึงซีพียู Sierra Forest 144 คอร์ของ Intel ซึ่งจะเปิดตัวในปี 2567
เอเอ็มดีกล่าวว่าแกนหลักที่มุ่งเน้นระบบคลาวด์ใหม่ที่หัวใจของแบร์กาโมนั้นถูกสร้างขึ้นจากปัจจัยเหล่านั้นทั้งหมด
สถาปัตยกรรมไมโครพื้นฐานของแกน Zen 4c นั้นเหมือนกับ Zen 4 ทำให้มีคุณสมบัติขั้นสูงที่เหมือนกันทั้งหมดและแม้กระทั่งประสิทธิภาพที่เท่ากันในแง่ของคำสั่งต่อสัญญาณนาฬิกา (IPC)
แกน CPU ใหม่เป็นผลมาจากการใช้งานทางกายภาพที่แตกต่างกันของ Zen 4 พร้อมกับโปรไฟล์ประสิทธิภาพต่อวัตต์ที่แตกต่างกันเอเอ็มดีกล่าวว่ามันเริ่มต้นจากระดับการถ่ายโอนการลงทะเบียน (RTL) เดียวกันกับ Zen 4 มาตรฐาน อย่างไรก็ตาม ได้นำการออกแบบทางกายภาพมาใช้ใหม่เพื่อประหยัดพลังงานอันมีค่าและพื้นที่ภายในโปรเซสเซอร์ ทำให้สามารถรวมคอร์เข้าด้วยกันบนไดย์ได้อย่างแน่นหนามากขึ้น .
Mike Clark หัวหน้าสถาปนิกของ Zen core ของ AMD กล่าวว่า cloud-native core นั้น “มีเหตุผล” เหมือนกับ Zen 4 แต่บริษัทได้ปรับแต่งแผนผังของ CPU อย่างละเอียดเพื่อรองรับลอจิกที่หนาแน่นมากกว่าความเร็วสัญญาณนาฬิกา
ความถี่สัญญาณนาฬิกาสูงเป็นการแลกเปลี่ยนกับพื้นที่ มากกว่าซีพียูสำหรับเซิร์ฟเวอร์ที่ใช้งานทั่วไป Genoa clocks ที่ความถี่สูงสุด 4.1 GHz เพื่อจัดการกับปริมาณงานที่หลากหลายที่เกิดขึ้นในศูนย์ข้อมูลโดยเฉลี่ย AMD กล่าวว่าได้ลดความเร็วสัญญาณนาฬิกาสูงสุดของ Bergamo เนื่องจากมีการเพิ่มความถี่แกนเดียวที่ 3.1 GHz
ในขณะที่แกน Zen 4 และแคช L2 ด้านในพอดีกับซิลิคอนสี่เหลี่ยมผืนผ้าขนาด 3.84 มม. พื้นที่ของ Zen 4c ที่โฟกัสบนคลาวด์ของแบร์กาโมวัดได้เพียง 2.48 มม. 2 ซึ่งแปลว่าประหยัดพื้นที่ถึง 35%
เมื่อทุกอย่างอยู่ใกล้กันมากขึ้นภายในคอร์ CPU จึงใช้พลังงานน้อยลงในการถ่ายโอนสัญญาณรอบตัว นี่เป็นการเปิดประตูให้บริษัทถอดทรานซิสเตอร์ที่กินไฟจำนวนมากในแกน Zen 4 ออกเพื่อส่งต่อสัญญาณในระยะทางที่ไกลขึ้น คลาร์กกล่าว
นอกเหนือจากแกนหลักแล้ว ความแตกต่างที่สำคัญอื่น ๆ คือการลดหน่วยความจำแคช ในขณะที่แคช L2 ในแกน Zen ที่เน้นระบบคลาวด์ยังคงเหมือนเดิม แคช L3 ที่แชร์โดย CPU ทั้งหมดในชิปเล็ตลดลง 50% จาก 4 MB เป็น 2 MB ต่อคอร์เพื่อประหยัดพื้นที่ตายเพิ่มเติม
คอร์จำนวนมากและความเร็วที่ลดลงทำให้แบร์กาโมประหยัดพลังงานได้ดีกว่าเจนัว ซึ่งเป็นข้อพิจารณาอย่างมากในศูนย์ข้อมูลคลาวด์และการติดตั้งเซิร์ฟเวอร์ขนาดใหญ่อื่นๆ
Chiplets น้อยลง คอร์มากขึ้น
แบร์กาโมใช้สถาปัตยกรรมชิปเล็ตแบบเดียวกับเจนัว(รูปที่ 3 ) แต่การปรับปรุงคอร์และแคชทำให้สามารถเพิ่มจำนวนคอร์เป็นสองเท่าต่อคอร์คอมเพล็กซ์ดาย (CCD) เป็น 16
เอเอ็มดีกล่าวว่าได้หลอมรวมแปดชิปเล็ตเหล่านี้เข้าด้วยกันรวมเป็น 128 คอร์ Zen 4c ในแพ็คเกจเดียวที่รองรับทรานซิสเตอร์ได้มากถึง 82 พันล้านตัว การจัดเรียงคอร์ที่หนาแน่นกว่านั้นตรงกันข้ามกับเจนัว ซึ่งรวมชิปเล็ต CPU 12 ชิปเล็ตเข้าด้วยกัน โดยแต่ละคอร์มีมากถึง 8 คอร์ รวมทรานซิสเตอร์ทั้งหมดมากถึง 90,000 ล้านทรานซิสเตอร์
ในแบร์กาโม คอร์ CPU 16 คอร์ถูกแบ่งย่อยออกเป็นคลัสเตอร์ 8 คอร์คู่หนึ่ง ซึ่งแต่ละคอร์มีสิทธิ์เข้าถึงแคช L3 ขนาด 16 เมกะไบต์ ดังนั้น แม้ว่าชิปเล็ตทุกตัวจะมีแคช L3 ในปริมาณที่เท่ากันกับเจนัวฐาน แต่จำนวนแกน CPU สองเท่าก็ต้องใช้ร่วมกัน
แม้จะมีความแตกต่างกับเจนัว แต่ I/O 6 นาโนเมตรแบบเดียวกันกับ Infinity Fabric ของ AMD นั้นตั้งอยู่ที่ใจกลางของแบร์กาโม ทำให้เป็น DDR5-4800 12 แชนเนล 128 เลนของ PCIe Gen 5 และคุณสมบัติการเชื่อมต่ออื่นๆ ของเจนัว( รูปที่ 4) . รองรับ Compute Express Link (CXL) 1.1ซึ่งเป็นแคชที่เชื่อมต่อระหว่างกันใหม่สำหรับตัวเร่งความเร็วและการขยายหน่วยความจำที่ทำงานบน PCIe
สิ่งสำคัญคือ CPU ของ Bergamo มีคุณสมบัติในการระบายความร้อนและพลังงานแบบเดียวกับเจนัวที่ใช้งานทั่วไป โดยมี TDP 360 W กล่าวโดย Kevin Lepak หัวหน้าฝ่าย SoC เซิร์ฟเวอร์และสถาปัตยกรรมระบบสำหรับ EPYC ของ AMD
เนื่องจากใช้สถาปัตยกรรมเดียวกัน AMD กล่าวว่า Bergamo เข้ากันได้กับซอฟต์แวร์กับเจนัว CPU ยังเข้ากันได้กับซ็อกเก็ตอีกด้วย ซึ่งทำให้ง่ายต่อการแทนที่ EPYCs ปัจจุบัน
Robert Hormuth รองประธานองค์กรชั้นนำด้านสถาปัตยกรรมและกลยุทธ์สำหรับหน่วยศูนย์ข้อมูลของ AMD กล่าวว่าการปรับปรุงภายใต้ประทุนทำให้ Bergamo ได้เปรียบเหนือ Intel เขาอ้างว่าแบร์กาโมสามารถรันเวิร์กโหลดบนคลาวด์ได้เร็วกว่าชิป Xeon Scalable ล่าสุดของ Intel ถึง 2.6 เท่า ซึ่งก่อนหน้านี้เรียกว่า Sapphire Rapids
ในขณะที่ชิปเซิร์ฟเวอร์ระดับไฮเอนด์มักจะมีราคาแพง AMD กล่าวว่าประสิทธิภาพต่อวัตต์ที่สูงของแบร์กาโมสามารถช่วยลดต้นทุนการดำเนินงานของศูนย์ข้อมูลได้ในระยะยาว SKU เรือธงในตระกูลEPYC 9754ที่มี 128 คอร์และ 256 เธรด ราคาอยู่ที่ 11,900 ดอลลาร์
นอกจากนี้ บริษัทยังจำหน่ายซีพียูแบร์กาโมแบบเธรดเดี่ยว 128 คอร์ รุ่นEPYC 9754Sในราคา 10,200 ดอลลาร์
โฆษณา