中國網/中國發展門戶網訊“開源”(open source)全稱為開放源代碼,其最大的特點是開放,即在版權限制范圍之內任何人都可以得到源代碼,并加以修改學習、重新發放。開源模式于 20 世紀 80 年代初開始在軟件領域流行,現已成為軟件領域不可或缺的一種開發模式。2019 年的一組調查數據顯示,高達 99% 的軟件使用開源組件。如今,開源模式已經擴展到硬件領域,尤其在處理器芯片領域,基于開源指令集 RISC-Ⅴ的開源芯片生態正在快速崛起,為包括中國在內的廣大發展中國家突破中央處理器(CPU)芯片領域的技術壟斷和市場壟斷帶來新機遇。但同時也不能盲目樂觀,開源軟件經歷了近 40 年的發展才形成今天的蓬勃態勢,而開源芯片還處于起步階段,要構建相對完整的技術體系進而形成一個開源芯片生態,仍然面臨諸多挑戰和難題。
科技開源的意義
2021 年 6 月,在 RISC-Ⅴ 中國峰會的大會主題報告中李世默提出一個鮮明的觀點:科技開源將會是突破科技排他性的有效手段。李世默認為,過去 30 年開展的全球化是封閉的全球化,發展模式通常由少數國家主導,最終形成了三大排他性,即經濟排他性、政治排他性和科技排他性。在這一輪全球化過程中,中國提出了“社會主義市場經濟”“人類命運共同體”“一帶一路”等一系列開放、包容的新路線、新理念、新倡議,并發起創辦亞洲基礎設施投資銀行,從而突破了經濟排他性與政治排他性。
科技排他性已成為全球化進程的主要障礙之一。以芯片領域為例,眾所周知,芯片已成為支撐各行各業的基石,但是芯片領域的關鍵技術集中在個別國家的少數企業,導致全球芯片產業發展極不平衡,且面臨極大的供應鏈風險。近期,全球陸續出現“缺芯潮”,導致汽車制造等重要工業領域停工停產,使世界各國都蒙受了不可估量的經濟損失玖陽視覺。中國作為制造業大國,仍需大量進口芯片,甚至面臨“卡脖子”困境。對于全球廣大發展中國家而言,更無力應對少數國家在芯片領域的技術和市場壟斷。
科技開源,其從單一走向多元,從排他走向包容,從普世走向普惠,展場設計將會是突破科技排他性的有效手段。事實上,開源也存在競爭,不投入就會在開源生態構建過程中喪失話語權和主導權。發達國家一直以來對科技開源比較重視。2016 年,美國政府發布《聯邦源代碼政策》,要求聯邦機構將新開發的源代碼以不少于 20% 的比例開源。過去 20 年,歐盟成員國(包括英國)共出臺了超過 75 份政策文件和 25 份法律文件,積極推動開源發展。發達開幕活動國家的企業與大學均十分重視對開源技術的投入。英特爾、谷歌、亞馬遜等國際知名企業,以及美國加利福尼亞大學伯克利分校、普林斯頓大學、麻省理工學院等世界一流大學都開發出有影響力的品牌活動開源項目。2018 年的一項統計顯示,在全球最大的開源代碼托管網站 GitHub 上,全世界參與開源項目人數最多的公司是微軟,有高達 4 550 名員工參與;谷歌則排第二,有 2 267 名員工參與。
2021 年 3 月發布的《中華人民共和國國民經濟和社會發展策展第十四個五年規劃和 2035 年遠景目標綱要》(以下簡稱《“十四五”規劃和 2035 年遠景目標》)中明確提出支持數字技術“開源”發展。科技開源,還需要引導中國企業、學術界加大對開源的投入,需要形成一批中國發起的有影響力的開源項目。
處理器芯片設計新趨勢:開源模式
芯片按功能可分為處理器芯片、存儲芯片和其他功能芯片。其中,處理器芯片是電子設備的“大腦”,作為基石和底板支撐了占我國國內生產總值(GDP)總額近 1/6 的信息產業。過去 20 年,我國一直高度重視處理器芯片產業的發展,出臺一系列產業政策并取得了積極效果,但一些企業仍面臨核心處理器芯片被“卡脖子”的困境。
近年來,開源指令集 RISC-Ⅴ 以其“指令集應該免費”(instruction sets want 參展to be free)的宗旨得到全世界的廣泛認可與積極投入。截至 2021 年 9 月,RISC-Ⅴ 國際基金會的會員已覆蓋 70 多個國家,總數已超過 2 300 個,其中企業和機構超 500 家。RISC-Ⅴ物聯網處理器芯片已大規模商用,僅國內就有超 5 億顆 RISC-Ⅴ 核心芯片投放市場;同時,開始出現使用先進工藝節點的中高端芯片研發投入,多家企業已開始布局 5/7人形立牌 nm 高性能 RISC-Ⅴ 處理器開發。開源開放也大幅度加速了處理器芯片架構創新,基于 RISC-Ⅴ 的類腦、眾核等新型計算芯片的研發方興未艾。未來數年,將出現 RISC-Ⅴ 與人工智能(AI)、高性能計算等產業互促發展的良好局面。
開源指令集打破了其他指令集屬于公司私有的現狀,為構建開源芯片生態技術體系提供了可能性。開源芯片,就是將芯片設計相關的源代碼和文檔免費公開,降低使用者的獲取成本,降低芯片設計的門檻。開源芯片發展新趨勢存在三大驅動力:“摩爾定律”逐漸放緩,領域專用體系結構(DSA)開始盛行,但 DSA 會引起碎片化問題,從而使得芯片設計成本與周期 2 個維度同時降低門檻;芯片研發門檻高客觀上阻礙了創新,而降低門檻平面設計激發了創新活力、繁榮了芯片產業;芯片架構人才緊缺,而降低門檻有助于快速和大規模培養高水平芯片設計人才。
從突破科技排他性角度來看,基于 RISC-Ⅴ 構建開源處理器VR虛擬實境芯片生態,既有機會破解我國核心處理器芯片被“卡脖子”的現狀,又能夠協同全球各國特別是眾多發展中國家共同構建開源處理器芯片生態,并開拓新興應用市場。這是一種突破處理器芯片壟斷格局的新路線,有望形成普惠世界的處理器芯片領域的“人類命運共同體”。
構建開源芯片生態技術體系的新機遇
開源軟件生態降低了軟件創新門檻
開源軟件經歷近 40 年的發展,如今各類商業軟件幾乎都有對應的開源版本,特別是操作系統、編譯器、數據庫、函數庫等基礎軟件,一些開源軟件綜合性能甚至優于商業軟件。這些開源軟件已經構成一套較為完整的技術體系,進而形成一個價值達到數百億美元的開源軟件生態。開源軟件生態降低了軟件創新的門檻,為軟件企業節省了大量的時間與成本。例如,開源軟件 LAMP組合或 MEAN組合已經成為互聯網公司(尤其是初創公司)構建業務的標配,讓企業可以更專注于業務創新。工業模型和信息化部統計數據顯示,截至 2018 年,我國擁有近 450 萬個手機應用程序(APP),數量雄踞世界第一,這正是受益于開源軟件極大地降低了 APP 的開發門檻。
處理器芯片設計具有規范的流程
相比價值已達數百億美元的開源軟件生態,開源芯片仍處于起步階段。雖然開源指令集 RISC-Ⅴ 得到全世界的積極響應,但僅經典大圖有指令集離一套較為完整的技術體系還有很大差距。如圖 1 所示,處理器芯片設計流程一般包括 3 個階段。
階段 1:根據指令集手冊進行微架構設計,輸出一系列設計文檔。
階段 2:投入相當的工程理論,把微架構設計實現為寄存器傳輸級(RTL)源代碼。
階段 3:使用電子設計自動化(EDA)工具將RTL 源代碼轉化為可供流片的芯片版圖。
開源芯片技術體系和 RISC-Ⅴ具有完善的層級
開源芯片技術體系的 3 個層次
一套完整的開源芯片技術體啟動儀式系包括 L1—全息投影—開源指令集、L2——開源設計實現、L3——開源工具 3 個層次(圖 1)。
L1——開源指令集。指令集架構 ISA(instruction set architecture)本質上是一種標準規范,其表現形式是一份手冊文檔。開源指令集的內涵包含 2 個方面:①任何人都可以免費獲取指令集手冊,根據手冊免費設計與實現自己的處理器芯片;②指令集的演進由開源社區共同制定,而不是由某個公司掌控。
L2——開源設計實現。處理器芯片的微架構設計一般由設計文檔展覽策劃記錄,處理器芯片的實現則是用硬件描述語言(如 VerilFRPog、Chisel 等)來描述設計文檔中的微架構設計,形成一份寄存器傳輸級(RTL)源代碼。開源設計實現的內涵包含 2 個方面——微架構設計文檔和 RTL 源代碼,均可品牌活動免費獲取。
L3——開源工具。處理器芯片的設計與實現過程中需要使用各種工具,主要包括三大類:微架構設計空間優化工具,包括軟件模擬器、程序特征分析工具、性能/功耗建模與評估工具等;測試與驗證工具,包括不同層次(模塊級、組件級、IP 級、SoC 級等)的功能正確性驗證工具、錯誤定位與追蹤工具、形式化驗證工具、自動化測試框架與測試用例等; EDA 工具,包括綜合工具、布局布線工具、仿真工具、版圖生成與驗證工具等。
由此可見,L1 級是整個開源芯片技術體系的基礎;沒有 L1 級的開源指令集,則不可能有 L2 級開源設計實現。這也正是 RISC-Ⅴ 指令集的價值所在,它賦予了全世界所有人免費設計與實現處理器芯片的平等機會。雖然 L1 是基礎,但要設計與實現一個處理器,L2——開源設計實現與 L3——開源工具更為重要,而且 2 個層次緊密聯系。用操作系統作類比,可移植操作系統接口(POSIX)系統調用標準屬于 L1級,Linux 操作系統源代碼屬于 L2 級,C 語言/GCC 編譯器則屬于 L3 級。
RISC-Ⅴ的分級情況
根據上述開源芯片技術體系分類,可將 RISC-Ⅴ 的級別層次現狀進行梳理。
RISC-Ⅴ 處于 L1 級,它允許全世界任何人免費實現一個 RISC-Ⅴ 處理器,可以是商用,也可以開源,其中基于 RISC-Ⅴ 的商業處理器IP則停留在 L1 級。
目前,國際上已有超過 100 個開源 RISC-Ⅴ處理器實現,如伯克利的 Rocket/BOOM、阿里平頭哥半導體有限公司的玄鐵系列、芯來科技有限公司的蜂鳥 E200 等,這些開源RISC-Ⅴ 處理器都處于 L2 級。因為它們雖然開源了處理器源代碼,但相應的設計工具并未開源。
理想的 L3 級應該是設計與實現開源芯片的工具全部開源,目前全世界范圍尚未達到這個水平。中國科學院計算技術研究所開發了開源高性能 RISC-Ⅴ 處理器“香山”,同時將開發“香山”的一系列底層工具也開源,已經向 L3 級靠近。但“香山”也還未完全達到 L3 級道具製作,因為當前“香山”的開發過程中仍需大量使用商業 EDA 工具。只有開源 EDA 取得突破性進展,L3模型 級開大型公仔源芯片才能真正得以實現。
構建開源芯片生態技術AR擴增實境體系面臨的挑戰與對策
挑戰
當開源芯片技術體系達到 L2 級,就基本具備了構建開源芯片生態的條件。開源芯片生態的形成大型公仔,開源處理器(L2 級)僅僅是一個必要條件,還需要軟件、應用、人才、資金等多種關鍵要素。雖然 RISC-Ⅴ 在中國發展得如火如荼,但基于 RISC-Ⅴ 構建開源芯片生態仍面臨若干挑戰。
生態不成熟且碎片化嚴重。缺少技術主線和主導力量,尚不能真正有效匯聚全球研發力量,這阻礙了技術的持續迭代和應用拓展。
公共服務與賦能平臺缺位。國內自發形成的聯盟事實上承擔了極為有限的職能,組織松散且力度不大圖輸出足,無法形成對生態的系統性支持和引導。
尚未形成有效的國內合作機制。國內相關奇藝果影像科研院校、龍頭企業未能形成合力,諸多共性技術未能有序布局、合作攻關,重復投入導致資源浪費嚴重。
中國企業在 RISC-Ⅴ 國際基金會話語權仍需加強。我國 RISC-Ⅴ 相關企業和科研機構在與 RISC-Ⅴ 國際基金會的合作過程中攤位設計,雖有合作松散等自身原因,但更因國際話語權缺失,導致尚未能在國際上協同推動有利于我國的技術生態標準。
對策
20 世紀 80 年代以來,歐美國家形成了一批基于產業聯盟的創新聯合體,如MCC、SRC、IMEC和 Sematech等。經過近 40 年的發展,這些研究機構取得了業界公認的成就,在原始創新、技術轉移與專利共享、人才道具製作培養等方面取得了豐富的經驗,對全包裝盒球半導體集成電路產業發展起到了重要作用,受到政產學研等各方的好評和支持。因此,加速基于 RISC-Ⅴ 的開源芯片生態建設,需聯合多家企業共同開發共性基礎技術,這迫切需要在國內建設一個開源芯片新型研究機構作為總體研發平臺。對此,《“全息投影十四五”規劃與 2035 年遠景目標綱要》中提出了“支持數字技術開源社區等創新聯合體”的指導思路。聯合多家企業共同構建開源芯片生態,這正是《“十四五”規劃與 2035 年場地佈置遠景目標綱要》中大力倡導的“創新聯合體”模式。
目前,中國科學院計算技術研究所正積極探索構建開源芯片創新聯合體模式,準備聯合企業力量,匯聚地方資源,逐步形成國際領先且開放包容的 RISC-Ⅴ 協同創新體系,加速 RISC-Ⅴ 開源芯片生態建設。
20 世紀 80 年代,開源模式在軟件領舞臺背板域開始流玖陽視覺行,如今已經擴展到芯片設計領域。開源模式作為一種有效地突破科技排他性的手段,對于關鍵核心技術被個別國家的少數企業所壟斷的芯片領域,意義尤其重大——開源芯片有望聯合并賦能全世界更多國家特別是發展中國家的芯活動佈置片產業。當然,開源芯片仍處于起步階段,仍然面臨諸多挑戰和需要解決的問題。中國在開源芯片領域具備很好的條件,有機會成為開源芯片領域的引領者。
(作者:包云崗、孫凝暉,中國科學院計算技術研究所、中國科學院大學 計算機科學與技術學院、計算機體系結構國家重點實驗室;《中國科學院院刊》供稿)
發佈留言