“反正是流片,附近有几家图形芯片设计的企业,我去问问看能不能拼个车?”他和蔺落鸿打了个招呼,就打算抓紧落实他芯片的下步工艺。
从第一版设计到定型,往往需要经历多次流片,业内对每次流片的价格苦不堪言,所以也找到了一些降低成本的办法,MPW多项目晶圆就是其中之一,技术表达是将多个使用相同工艺的集成电路设计放在同一晶圆片上流片,制造完成后,每个设计可以得到数十片芯片样品。
流片成本高大部分是MASK也就是掩模的锅,比较贵,例如40nm的MASK大约在450万左右,而28nm的MASK大约在920万左右,14nm的MASK大约在2300万左右。不同厂家有差异,赶上年景好的旺季,代工厂就死要价,淡季的话代工厂会有优惠。
TSMC芯片代工厂还有一条微米级教育线,一直对他主厂区新竹附近学校的学生免费流片,说明这世界尽管有诸多问题,但是依旧有人为了美好一点点而努力。
陈洋记得产业园区的前方有好几家图形芯片的老牌公司,应该都有流片的需求,他打算去商谈一番,如果没有正好匹配的时间段,陈洋就只好找专门代理MPW的拼车公司去了。
还没出门就被堵回来,已经检验过逻辑图的克里斯丹尼尔还有阿舒雷格走进陈洋的办公室,遗憾地通知陈洋他们:AI图形芯片设计引擎画出的逻辑图完全不能用,错误太多。
具体来说,SP流水线有问题,寄存器数量也不对,这些都是图形芯片的核心流处理器的设计问题,貌似陈洋设计的图形芯片设计引擎AI又菜还又爱画,生成的超大规模流处理器如同贴纸生硬得拟合在一起。
数字电路设计到极为高深处,就是很需要经验的事情,阿舒雷格这种顶级的图形芯片架构师解释了几句:“速度的提升与流处理器数量不是简单的线性关系。虽然增加流处理器可以提高并行性,但在实际应用中,遇到倾向于串行处理的任务,就根本不会带来速度上的显著提升。反复去找那个流处理器数量上的甜蜜点,还不如把精神放在优化电路设计、减少访存次数、增加数据通路带宽这种事半功倍的工作上。”
克里斯丹尼尔接着说了下去:”流处理器越多,热量越大,如果无法有效地散热,就会导致芯片过热,反而影响性能和寿命。另外,功耗也是个大问题,3个8pin的供电可不是每个人都接受得了,另外,16G的显存意义不大……”
综合评价,两人认为这款AI图形芯片设计引擎像那么回事,但是完全不是那么回事。这下把陈洋搞郁闷了。
蔺落鸿拍了拍陈洋的肩膀:“继续研究吧,科研哪里是那么容易就能得出来结果的,罗马也不是一日建成的。”
“我觉得是数据精度不够,可能是陈在标注图纸的时候,没有实现清晰和准确标注,因此模型的可靠性和精度没有达到预期。”
“我觉得是数据样本不够,我们看能否提供给你更多的显示芯片的设计图。”
两个看似内行的外行提出了各自的想法,尤其是高级系统架构师阿舒雷格热情地提供了自GT8800以后的二十余款显示核心的设计图。
陈洋不得已把心中那张流程图的勾再去掉,重新陷入到绝望的标注数据的工作中,AI学习和人类学习在本质上并无不同,都是通过经验和信息来提高自身的能力,只不过人类通过感知、思考、行动和反馈等方式从环境中获取经验, AI模型通过处理数据和反馈信号来获得经验,陈洋得告诉这个笨蛋模型若干次:大的、植物果实、不太圆、肯定不是完美圆的红色、淡粉红色的这个东西,是苹果!
感谢过两位高手之后,陈洋做出了自己的判断,他认为两位高手的说法各有可取之处,数量,决定模型的广度,质量,决定模型的精度。
除了数据数量和质量之外,数据的分布也非常重要。在训练神经网络时,需要将数据分为训练集、验证集和测试集。这些数据集应该包含具有不同特征的数据样本,以避免出现过拟合或欠拟合等问题。
陈洋抱着脑袋想了一天,才终于想明白为什么图形芯片架构师不建议他去找流处理器数量上的甜蜜点,因为芯片会在生产时进行分级筛选,屏蔽掉生产时出现问题的流处理器,然后把整块芯片降级使用。比如vega核心完整流处理器数量是4096个,屏蔽一部分可以变成3584个,商业上的销售名称就从vega64变成了vega56。
这种知识和经验,如果不是曾经拉通过整条产品线的人根本想不明白,代工厂生产和商业选择的结果,反过来对芯片设计工程师设计初期造成影响,给新手理解完全就是匪夷所思的事情。
如同早晨吃过一堆东西,晚上发现身体不适,这时候自己知道食物过敏了,而准备早点的阿姨却对此一无所知,假如不通知她,明早还会是这个结果。
其实克里斯丹尼尔还打算调来辉达图形的算力服务器,结果一看陈洋他们用得是超微农机的服务器,顿时表情怪异起来:“陈,你要知道,论起CUDA,我们的算力集群才是世界第一,超微农机?他们是向量计算SIMD单指令多数据的异教徒。”
尽管超微和辉达的恩恩怨怨发生在企业层面,普通员工的交往流通也很频繁,但是就具体技术而言,研发工程们确实对于某些技术存在信仰,也确实对自身信仰的技术事业奋斗终身。
没有信仰,谁能把一件事坚持一辈子?
前有困惑了数十代工程师的锗硅之争,这个命题相当大,直到二十一世纪第一个十年IBM工程师还是有不信邪的,搞出来锗硅芯片,确实性能比同期的硅芯片性能高,就是成本造价受不了。
后有点采样和双线性插值的像素填充方式,单指令多数据和多指令多数据的处理器架构,共享内存还是全局内存……
反正在工程师眼中,与自己技术路线相悖者一律应该被扣上了“异端”的帽子,只恨宗教裁判所这些年威望不彰,不能像点哥白尼一样点火烧了,多少留有几分遗憾在心头。
就这么说来,怕是党同伐异才是天下至理,人间正道。