Chip Quang tử: Từ Nghiên cứu tại IBM đến Hạ tầng AI của Nvidia
Table of contents
- Nguồn gốc: Silicon và Quang tử
- Kỷ nguyên mô-đun cắm: Tính linh hoạt là lợi thế cốt lõi
- Những giới hạn của kiến trúc truyền thống
- Broadcom: Tiên phong trong công nghệ CPO
- Nvidia: Động lực cho hạ tầng AI Factory
- Khác biệt trong triết lý thiết kế
- Góc nhìn từ đơn vị vận hành hạ tầng
- Triển vọng phát triển
- Tài liệu tham khảo
Trong hai năm gần đây, công nghệ quang học đồng đóng gói (CPO) đã vượt khỏi khuôn khổ nghiên cứu lý thuyết. Broadcom đã liên tục cải tiến nền tảng CPO Tomahawk qua nhiều thế hệ, đồng thời Nvidia cũng chính thức đưa Spectrum-X Photonics và Quantum-X Photonics vào danh mục sản phẩm thương mại trong chiến lược xây dựng các nhà máy AI. Điều này cho thấy việc rút ngắn khoảng cách giữa các linh kiện quang và chip ASIC không còn dừng ở mức thử nghiệm, mà đã trở thành một phương án kiến trúc khả thi cho các mạng AI fabric mật độ cao.
Đây là một sự chuyển dịch mang tính bước ngoặt đối với thị trường. Trong suốt nhiều thập kỷ, hệ sinh thái thiết bị quang dạng cắm — từ SFP đến QSFP-DD và OSFP — luôn được xem là mô hình tối ưu cho phần lớn các mô hình triển khai mạng, nhờ vào tính linh hoạt, khả năng thay thế và năng lực mở rộng đa dạng các loại liên kết trên cùng một hạ tầng. Tuy nhiên, khi băng thông, mật độ cổng và mức tiêu thụ năng lượng trong các cụm AI gia tăng nhanh chóng, những giới hạn của đường truyền điện giữa ASIC và khung mô-đun ở mặt trước ngày càng bộc lộ rõ. Trong bối cảnh đó, CPO không còn đơn thuần là một phương án dự phòng cho tương lai, mà đã trở thành một giải pháp kỹ thuật thiết thực để giải quyết các rào cản vật lý hiện nay.
Tại IPTP Networks, chúng tôi tiếp cận sự chuyển dịch này dưới góc nhìn thực tiễn: CPO không nhằm thay thế hoàn toàn hệ sinh thái quang học hiện hữu, mà định hình một phân khúc giải pháp riêng cho các tác vụ chuyên biệt. Để hiểu rõ cách CPO đang tái cấu trúc bài toán kinh tế và thiết kế trung tâm dữ liệu, cần xem xét lộ trình phát triển của công nghệ này — từ các nghiên cứu nền tảng về Silicon Photonics, qua các giai đoạn triển khai quy mô lớn với mô hình quang học dạng cắm, cho đến các hệ thống CPO thương mại đang dần định hình hạ tầng AI.
Đây là thời điểm mà công nghệ, sau nhiều thập kỷ phát triển, đã tiệm cận ngưỡng ứng dụng thực tiễn, chuyển dịch từ các mô hình lý thuyết sang triển khai trực tiếp ở cấp độ tủ rack. Trong bối cảnh đó, cần nhìn nhận toàn diện bức tranh công nghệ: từ nguồn gốc hình thành, những yếu tố giúp quang học dạng cắm trở thành trụ cột của hạ tầng mạng, cho đến các chuyển dịch mang tính nền tảng đang diễn ra.
Nguồn gốc: Silicon và Quang tử
Ý tưởng khai thác silicon — vật liệu nền tảng của vi điện tử — để dẫn hướng và điều biến ánh sáng đã xuất hiện từ giữa những năm 1980. Các công trình tiên phong của Richard Soref, cùng với sự phát triển của nền tảng silicon trên chất cách điện (SOI), đã đặt nền móng cho Silicon Photonics hiện đại: các ống dẫn quang tương thích với quy trình sản xuất CMOS, cho phép tích hợp các linh kiện quang và điện tử trên cùng một đế công nghệ.
DARPA sớm xác định đây là một nền tảng có tiềm năng ứng dụng cao. Thông qua chương trình EPIC, cơ quan này đã tài trợ cho các nghiên cứu tại MIT, Đại học California, Santa Barbara cùng nhiều nhóm khác, qua đó hình thành các thành phần cốt lõi như bộ dò quang germanium trên silicon và laser silicon lai. Trong số này, laser là thách thức kỹ thuật lớn nhất do silicon không có khả năng phát xạ ánh sáng tự nhiên; vì vậy, việc tích hợp nguồn laser lên chip đã trở thành một trọng tâm nghiên cứu then chốt của lĩnh vực trong nhiều năm.
Bước ngoặt thương mại đầu tiên thuộc về Luxtera. Được thành lập năm 2001, công ty tập trung phát triển các mạch tích hợp quang học sản xuất trên quy trình CMOS tiêu chuẩn. Đến năm 2012, Luxtera đã xuất xưởng kênh Silicon Photonics 10Gbps thứ một triệu, trước khi được Cisco mua lại vào năm 2019 nhằm củng cố năng lực quang học cho phân khúc webscale và các nhà cung cấp dịch vụ.
IBM cũng theo đuổi một lộ trình tương tự. Sau hơn một thập kỷ nghiên cứu, đến năm 2012, hãng công bố việc chuyển giao công nghệ nanophotonics silicon sang quy trình đúc CMOS silicon trên chất cách điện 90nm ở quy mô thương mại. Điểm then chốt nằm ở khả năng đồng tích hợp các thành phần như ghép kênh theo bước sóng, bộ điều biến, bộ dò và transistor trên cùng một dây chuyền sản xuất. Đây là cột mốc mà Silicon Photonics bắt đầu chứng minh được hiệu quả kinh tế trong sản xuất quy mô công nghiệp.
Intel bước vào giai đoạn thương mại hóa sau nhiều năm phát triển nội bộ, với việc triển khai đại trà các mô-đun quang cắm dựa trên Silicon Photonics từ năm 2016. Tính đến nay, hãng cho biết đã xuất xưởng hơn 8 triệu mạch PIC và 32 triệu laser tích hợp trong các bộ thu phát dành cho trung tâm dữ liệu. Những con số này cho thấy Silicon Photonics đã trở thành một thành phần tiêu chuẩn trong hạ tầng mạng hiện đại.
Kỷ nguyên mô-đun cắm: Tính linh hoạt là lợi thế cốt lõi
Trong giai đoạn đầu, Silicon Photonics đạt được thành công nhờ thích nghi với một định dạng sản phẩm cụ thể: các bộ thu phát dạng cắm như SFP, QSFP-DD hay OSFP. Những mô-đun có khả năng thay thế nóng — tức có thể tháo lắp trực tiếp trong khi hệ thống vẫn đang vận hành — hoàn toàn phù hợp với yêu cầu thực tế của môi trường mạng.
Đối với các nhà cung cấp dịch vụ đám mây và đơn vị vận hành hạ tầng CNTT, ưu điểm của mô-đun dạng cắm thể hiện rất rõ: cho phép linh hoạt điều chỉnh tầm xa, giao diện và lớp quang học mà không cần thay thế thiết bị nền; đồng thời hỗ trợ dự phòng hiệu quả và rút ngắn thời gian xử lý sự cố thông qua việc thay thế nhanh tại chỗ. Nhờ đó, quang học dạng cắm đã duy trì vai trò nền tảng trong suốt nhiều thập kỷ.
Silicon Photonics tham gia vào hệ sinh thái này bằng cách nâng cao mức độ tích hợp và độ tin cậy trong sản xuất, đồng thời vẫn duy trì chuẩn kiểu dáng công nghiệp truyền thống nhằm đảm bảo tính tương thích và thuận tiện trong vận hành.
Những giới hạn của kiến trúc truyền thống
Vì sao CPO trở nên cần thiết? Nếu các mô-đun Silicon Photonics dạng cắm đã phát triển hoàn thiện, được ứng dụng phổ biến và tiếp tục mang lại giá trị, vậy yếu tố nào đang thúc đẩy sự dịch chuyển sang quang học đồng đóng gói?
Câu trả lời nằm ở các ràng buộc vật lý giữa ASIC của switch và khối mô-đun cắm ở mặt trước. Trong kiến trúc truyền thống, tín hiệu điện tốc độ cao phải truyền qua các đường dẫn trên bảng mạch in để đến mô-đun quang, nơi chúng được chuyển đổi thành tín hiệu quang. Ở các mức 100Gbps hoặc 400Gbps, những tổn hao này vẫn nằm trong ngưỡng chấp nhận được. Tuy nhiên, khi tiến tới 1.6Tbps, mỗi milimét đường truyền điện đều làm gia tăng suy hao tín hiệu và mức tiêu thụ năng lượng.
CPO giải quyết bài toán này bằng cách đưa khối quang tích hợp đến gần trực tiếp với silicon của switch. Việc rút ngắn tối đa chiều dài đường truyền điện giúp giảm đáng kể suy hao tín hiệu và tổn thất năng lượng. Nhờ đó, hệ thống có thể đạt mật độ cao hơn, tiêu thụ điện năng thấp hơn và vận hành ổn định ở các mức băng thông mà kiến trúc truyền thống khó có thể đáp ứng một cách hiệu quả.
Broadcom: Tiên phong trong công nghệ CPO
Trước khi CPO trở thành một xu hướng chủ đạo, Broadcom đã phát triển công nghệ này theo một định hướng bài bản. Năm 2021, hãng giới thiệu Humboldt (25.6Tbps) dựa trên nền tảng Tomahawk 4, tiếp theo là Bailly (51.2Tbps) — hệ thống chuyển mạch Ethernet CPO đầu tiên được thương mại hóa.
Kiến trúc của Bailly tích hợp tám khối quang 6.4Tbps trực tiếp cùng với ASIC chuyển mạch. Cùng với các đối tác, Broadcom đã hoàn thiện toàn bộ hệ sinh thái phụ trợ, từ thiết kế tản nhiệt, quy trình lắp ráp và kiểm thử (OSAT) đến định tuyến sợi quang và giải pháp kết nối. Đây là minh chứng cho một lộ trình phát triển kỹ thuật có quy trình qua nhiều thế hệ sản phẩm.
Các chỉ số vận hành thực tế cho thấy độ ổn định và mức độ hoàn thiện của giải pháp: hệ thống đạt tới một triệu giờ hoạt động liên tục không gián đoạn tại hạ tầng của Meta. Đồng thời, các đối tác như Delta đã giới thiệu hệ thống 3RU dựa trên Tomahawk 5 Bailly, hỗ trợ làm mát bằng chất lỏng và giúp giảm hơn 30% mức tiêu thụ điện năng so với các switch truyền thống.
Định hướng phát triển của Broadcom đến năm 2025 và xa hơn, với các thế hệ đạt 200Gbps và 400Gbps trên mỗi lane, cho thấy sự tập trung rõ ràng vào các hạ tầng AI quy mô lớn.
Nvidia: Động lực cho hạ tầng AI Factory
Nvidia đã đưa Silicon Photonics vào chiến lược AI Factory thông qua việc công bố các nền tảng Spectrum-X Photonics và Quantum-X Photonics. Ở giai đoạn này, hãng tập trung đưa công nghệ vào lộ trình sản phẩm chính thức, qua đó tạo điều kiện để các khách hàng quy mô lớn tích hợp vào các hệ thống thế hệ mới.
Về mặt kỹ thuật, Nvidia lựa chọn kiến trúc sử dụng các khối quang học có thể tháo rời, bố trí xung quanh ASIC của switch thay vì tích hợp nguyên khối. Cách tiếp cận này giúp đơn giản hóa công tác vận hành và bảo trì, cho phép thay thế các mô-đun quang bị lỗi mà không cần can thiệp trực tiếp vào ASIC.
Nền tảng này được xây dựng trên công nghệ COUPE và kỹ thuật xếp chồng SoIC-X của TSMC, cho phép liên kết mạch tích hợp quang và mạch điện tử thông qua các giao diện có độ dài cực ngắn. Nvidia sử dụng bộ điều biến vi vòng cùng với các khối quang 1.6Tbps nhằm tối ưu hiệu suất năng lượng và nâng cao khả năng phục hồi của mạng trong các hệ thống AI fabric. Trong kiến trúc này, quang học không còn là thành phần ngoại vi mà trở thành một phần tích hợp chặt chẽ trong thiết kế tổng thể của hệ thống.
Khác biệt trong triết lý thiết kế
Broadcom theo đuổi mô hình theo chiều ngang: một kiến trúc CPO dựa trên chuẩn Ethernet mở, phù hợp với các nhà khai thác cần khả năng tương thích đa tầng và lộ trình nâng cấp theo từng bước.
Ngược lại, Nvidia xây dựng một kiến trúc tích hợp theo chiều dọc, trong đó các giải pháp quang học gắn chặt với hệ sinh thái GPU, NVLink và mô hình AI Factory, tạo nên sự đồng bộ chặt chẽ giữa lớp tính toán và hạ tầng mạng.
Góc nhìn từ đơn vị vận hành hạ tầng
Mặc dù CPO mang lại nhiều ưu thế, công nghệ này hiện chủ yếu phù hợp với các cấu trúc liên kết cố định trong những trung tâm dữ liệu AI quy mô rất lớn, nơi hiệu suất năng lượng và mật độ tích hợp được đặt lên hàng đầu.
Trong khi đó, đối với các mạng viễn thông, mạng đường trục và môi trường doanh nghiệp, quang học dạng cắm vẫn giữ vai trò chủ đạo nhờ:
- Tính linh hoạt trong việc lựa chọn loại giao diện quang và phạm vi truyền dẫn theo nhu cầu
- Khả năng thay thế và xử lý sự cố nhanh chóng tại chỗ
- Hỗ trợ đa dạng các cấu hình vận hành trên cùng một nền tảng thiết bị
Vì vậy, các chuẩn QSFP-DD, OSFP và các mô-đun coherent vẫn là lựa chọn tối ưu trong những môi trường ưu tiên tính linh hoạt hơn là mật độ tích hợp tối đa.
Việc lựa chọn giữa CPO và mô-đun dạng cắm do đó cần dựa trên sự phù hợp về kiến trúc, thay vì chỉ theo các xu hướng công nghệ nhất thời. Trong một số trường hợp — điển hình là các mạng AI fabric mật độ cao với topo được thiết kế cố định — quang học đồng đóng gói mang lại lợi thế rõ rệt về hiệu quả năng lượng, mật độ tích hợp và độ tin cậy. Ngược lại, trong các môi trường đề cao tính linh hoạt, khả năng thay thế nhanh tại chỗ và nhu cầu đa dạng về cấu hình quang học, các giải pháp dạng cắm vẫn sẽ là lựa chọn hợp lý trong dài hạn. Chính tại điểm giao thoa giữa hai mô hình này mà quyết định kiến trúc then chốt cho các trung tâm dữ liệu và cụm AI thế hệ mới đang được định hình.
Triển vọng phát triển
Những gì Nvidia nhấn mạnh tại GTC trong hai năm gần đây, cùng với hướng đi mà Broadcom đang thể hiện qua lộ trình CPO và các triển khai thực tế tại Meta, thực chất đang chỉ về cùng một điểm: Silicon Photonics trong mô hình đồng đóng gói đã bước qua ranh giới của một công nghệ mang tính nghiên cứu. Các mảnh ghép cần thiết cho triển khai thực tế đã hiện diện — từ năng lực sản xuất của TSMC, hệ sinh thái linh kiện quang, đối tác đóng gói, cho đến các thiết kế tham chiếu sẵn sàng đưa vào hệ thống.
Nếu nhìn lại toàn bộ quá trình phát triển, từ những khái niệm ban đầu về dẫn sóng quang trên silicon đến các hệ thống nơi phần quang được đặt sát ngay cạnh chip chuyển mạch, có thể thấy đây là một chu kỳ công nghệ lớn vừa vượt qua giai đoạn thử nghiệm để bước vào sản xuất thực tế. Nhưng điều đáng chú ý là sự chuyển dịch này không “thay thế” quang học dạng cắm. Nó đơn giản là mở ra thêm một lớp giải pháp mới, tồn tại song song với những gì đã có.
Với các đơn vị vận hành mạng lưới toàn cầu và trung tâm dữ liệu như IPTP Networks, ý nghĩa của thay đổi này không nằm ở việc tuyên bố một kỷ nguyên kết thúc, mà ở việc hiểu đúng nơi nào công nghệ mới thực sự tạo ra khác biệt. Khi thiết kế một cụm AI, nâng cấp mạng trong trung tâm dữ liệu, hay khi cân nhắc chuyển lên các thế hệ kết nối 800Gbps hoặc 1.6Tbps, điểm khởi đầu không nên là việc lựa chọn nhà cung cấp, mà là xác định kiến trúc phù hợp. Quan trọng là hiểu rõ trong những trường hợp nào CPO thực sự mang lại lợi thế về hiệu quả năng lượng và mật độ tích hợp, và khi nào mô-đun quang dạng cắm vẫn là phương án hợp lý hơn về tổng thể.
Phần còn lại, suy cho cùng, vẫn là những bài toán kỹ thuật quen thuộc: triển khai hậu cần ở quy mô toàn cầu, vận hành, bảo trì và điều chỉnh hệ thống theo điều kiện thực tế. Công nghệ có thể thay đổi, nhưng cách tiếp cận dựa trên phân tích, kỹ thuật và kinh nghiệm vận hành thì không.
Tài liệu tham khảo
- NVIDIA ra mắt Spectrum-X Photonics: Dòng switch CPO hỗ trợ mở rộng quy mô các mô hình AI Factory lên tới hàng triệu GPU.
- GTC 2026: Tổng hợp nội dung thuyết trình và tài liệu kỹ thuật tại sự kiện.
- NVIDIA Technical Blog: Tầm nhìn mới về mạng trung tâm dữ liệu dựa trên nền tảng chuyển mạch Silicon Photonics.
- NVIDIA Technical Blog: Tối ưu hiệu suất năng lượng cho các mô hình AI Factor thông qua kiến trúc CPO.
- NVIDIA Blog (SC25): Công bố các dự án tích hợp hệ thống cùng TACC, Lambda và CoreWeave.
- TSMC: Thông số kỹ thuật nền tảng COUPE và công nghệ đóng gói SoIC-X.
- Broadcom: Công bố lộ trình CPO thế hệ thứ 3 với băng thông 200 Gbps mỗi lane.
- Broadcom: Báo cáo về tiêu chuẩn chất lượng và độ tin cậy của thiết bị quang đồng đóng gói (CPO).
- Broadcom: Giới thiệu Bailly — switch Ethernet CPO đầu tiên trên thế giới đạt ngưỡng 51.2 Tbps.
- Delta Electronics (COMPUTEX 2025): Ra mắt nguyên mẫu switch ứng dụng công nghệ CPO.
- APNIC Blog: Phân tích chuyên sâu về kiến trúc và ứng dụng của phương pháp Quang học đồng đóng gói.
- DARPA: Tổng quan về mục tiêu và thành tựu của chương trình nghiên cứu EPIC.
- IBM Research: Công bố về linh kiện quang tử và quy trình tích hợp nanophotonics trên dây chuyền CMOS 90nm.
- IBM Media: Lộ trình thương mại hóa và chuyển giao quy trình sản xuất nanophotonics silicon.
- Cisco: Hồ sơ thương vụ sáp nhập Luxtera và chiến lược phát triển mảng thiết bị quang.
- Luxtera Milestone: Báo cáo cột mốc cung ứng 1 triệu kênh 10G dựa trên công nghệ CMOS photonics.
- Intel Silicon Photonics: Cổng thông tin chính thức và báo cáo dữ liệu kỹ thuật.
- Intel: Công bố giải pháp I/O quang học và thống kê sản lượng thiết bị xuất xưởng.
- Meta Engineering: Tiêu chuẩn thiết kế và vận hành các kết nối quang học 100G.
- Richard Soref: Tư liệu lịch sử và các cột mốc phát triển sơ khai của ngành Silicon Photonics.
- Thị trường thiết bị thu phát: Phân tích bối cảnh và xu hướng dịch chuyển của ngành quang học viễn thông.
