年近三十,科技立业 第30节

  “会成长?”张建惊大了嘴巴,他本就是专业人士,一句话,他就明白了纪弘的意思,但这……

  “你这什么表情?很惊讶吗?这可是类思维架构,越用就会越强!”纪弘笑着上下甩了两下脑袋:

  “这可是我们的最大优势,CTCA团队你那边应该是有所领会的啊,他们过去上过两次课,理念我都传达了,他们没跟你汇报?”

  “我……”张建哑口无言,团队Leader好像是跟他汇报过来着,说是上线以后可以优化参数、提高性能,他当时还以为是常规优化呢,感情是这么个优化法相当于AI的反馈强化学习了。

  “是啊!反馈强化学习,我们的架构本身就是类思维架构,就是基于AI的,长期使用就相当于训练过程,就能成长,越用越强不是理所当然的吗?”纪弘强调道:

  “而且不仅是运算架构,超大规模的片间互联系统也是如此。你也知道,集群的规模越大,通信造成的损失也会越大。

  “像这种千卡智算中心,一千张卡集群起来的真实的性能不可能达到一张卡的一千倍,事实上,传统集群能达到总性能的30%就是个大坎儿。

  “而我们,利用这种类似AI训练中反馈强化学习的方式,不说高,如果能优化到60%,你知道意味着什么吗?”

  张建不自觉的抽动,想说什么却又不知道说什么好60%,你这是上来就要把世界最先进水准提高一倍啊,我还能说什么?

  纪弘没有去管张建心中在想什么,而是接着说道:

  “提高到60%,这就意味着,千卡规模智算中心,我们和同规模RTX4090的AI算力就能相当了,丝毫不落后!

  “如果像你所说,你们下一代的AI卡能有A100一半的规模,CTCA的优势加上片间互联系统的加持,同规模下,我们就能直接超过他们!

  “现在告诉我,你还怕什么?”

  “你这么一说,我突然信心就十足了!”原本还有些担忧的张建瞬间满血复活,中气十足的说道:“看来我们必须加快下一代算力卡的研发速度了!”

  纪弘点了点头,算力规模是硬实力,这还是非常重要的。

  两个人都知道,虽然宣传的时候拿耳语和私人工作助理来背书,但智算中心最终还是要靠算力总和说话。

  类思维模型虽然先进,但现阶段它是卷耳智能科技的绝密技术,不具备开源的条件。

  那就意味着大多数的企业还是需要利用现有的模型去训练自己的人工智能。

  或者也可以通过合作的方式共同开发,但是相关的训练一定是要通过卷耳智能科技的,就像河州大学成长引航大模型这样。

  不过,即便如此,类思维模型的理论在全世界也是迅速掀起了一阵飓风换句话说,哪怕不用,它的存在本身就是一个巨大的威慑。

  就像此刻,黄仁勋刚刚回到下榻的酒店,都没顾得上考虑时差的事儿,就立即就召集技术人员线上开会了。

  “卷耳智能科技专利申请里公开披露的资料,还有今天他们的创始人纪弘所说的类思维模型的原理,你们怎么看?”

  黄仁勋作为GPU的发明者,英伟达的创始人,本身自己就是技术大佬,这个问题其实他心里已经有答案了,但内心却在殷切的期盼和有人能够发出和自己不一样的声音。

  (本章完)

第54章 我觉得纯扯!

  “你们怎么看?”

  黄仁勋的话音刚落,就有一个声音传出来:“我觉得纯扯!”

  说话的是英伟达高级技术官,克里斯马拉乔夫斯基,他接着这么说道:“将小参数AI模型作为决策核心替代原本自由的神经网络节点,在理论上就不可能行得通。”

  “如果说原本的模型是一个线团,我们跑的很顺,像这么一搞,完全成了一团乱麻了!

  “训练效率不仅得不到提升,还造成了极大的困恼,就我目前的测试而言,百万参数模型训练时的损失已经高达70%。

  “而且,模型越大,损失也越大。到GPT4的水准,能损失到只剩千分之一不到。

  “换句话说,如果要用这种方式训练GPT4,要消耗原本一千倍的算力资源!什么狗屁的死思考模型?将一万个小参数模型放一起,就类比人了?扯淡吧!”

  克里斯听起来怨气颇深,自从卷耳智能科技的一百二十多项专利申请披露以来,克里斯这几天那是没有睡过一个好觉,别说类思维了,他感觉自己都快没有思维了。

  不过,他得出的结论跟黄仁勋的想法是不谋而合的。

  “可是耳语……”但一提到耳语,他们又都沉默了。

  因为耳语事实存在,效果他们都看到了,那么就一定存在一个方案能够做到。是选择相信纪弘的一番乱扯,还是继续无头苍蝇一般的乱撞,都不是一个好的选择。

  “还是要做!我们别无选择不是吗?”黄仁勋如此说道。

  “我们只是硬件供应商,这些东西让搞AI的头疼去不行吗?”克里斯如此说道:

  “你现在不是在中国吗?是否考虑去见一见卷耳智能科技的创始人,论GPU,全世界没有任何一家公司能比得上我们,这不是天然的合作者吗?”

  克里斯是葡萄牙人,他不懂国人的思维,而黄仁勋是懂一些的,心里也是不断的摇头,如果有可能,他早就去了。

  但卷耳智能科技第一个找上摩尔科技的时候他就知道,英伟达肯定是没戏的。倒不如指望OpenAI能够知耻而后勇,赶紧赶上来。

  “不过还是去见见吧,就算不成,也没有什么损失不是吗?”黄仁勋寻思,来都来了,这里离河州也不算太远。

  ……

  别说英伟达这种业内企业了,就算是八竿子打不着的网友们,这个夜晚也都选择不眠。

  时间已是深夜,科技圈还热闹的很,简直就像过大年。

  而“今年”的“春晚”只有一个主角,那就是类思维模型。

  “一百多项专利我全都整理了,纪大在河州大学智算中心项目的启动仪式上讲的那番话,我也反复琢磨过。

  “据此,我设计了一套实施方案【从0开始训练一套类思维大模型】,源程序上传到Gitee码云上了,地址是:https:‖gitee.com|cla*****king。有兴趣的可以下载下来一起试试,共同探讨。”

  “我试了,根本不行啊,这效率,还不如直接从0搭建GPT呢!”

  “你废话,专利文件肯定不可能给你披露细节的,这需要你一点点一点点的慢慢去试去调整,才能达到最佳。”

  “能达到吗?我怎么觉得这就是个坑呢?我用数学模型做了一下评估,所有条件都考虑进去,看多少参数的小模型替代神经网络节点,结果是多少你们知道吗?答案是1。”

  专业的IT社区都是业内人士,尤其是今天,CSDNBlog人工智能分区更是一群AI领域大佬的聚集地。

  答案是1代表什么意思,他们再明白不过了那就是现有神经网络模型的效率就是最高的,任何改变都只会影响效率,而不会提高效率。

  “把你的计算过程贴出来,我们一起看看……”

  “好!”这个人名为孙博,毕业于信息科技大学本科,国科大硕士、博士,现为科学院自动化所人工智能基础前沿理论研究室研究员。

  ……

  纪弘也在窥屏,他是CSDN的老用户了,也经常会在里面发一些东西,今天从河州大学回来以后,也是照例进来看了看。

  正好就看到这群人在讨论类思维模型的事儿,也就一直在盯着。

  当孙博把所有的计算过程贴出来的时候,他也是第一时间就下载了下来。

  计算过程极为复杂,涉及到微分、积分、线性代数、离散数学、最优化理论、信息论等一大堆学科的交叉。

  如果不是最近能力一直在+0.1+0.1的不断在提升着,这么复杂的东西他都有可能看不懂。

  “这人不简单呐!”好久之后,纪弘才感叹着,不知道是哪位大佬,有没有机会挖过来?

  这么想着,纪弘挑了一些纯理论且不涉及机密的东西给他私信了过去:“我看博主水平非常高,对这个方向有兴趣吗?有机会可以聊聊。”

  发过去之后,纪弘就没再管他,又在窥屏了。

  还别说,专业的论坛不太经常冒泡的还真有几个大牛,今天趁着这个“团圆夜”全都出来了,纪弘就看到好几个。

  “看样子确实是的,这个理论行不太通啊!”一位名为“人工智能杂谈”的博主说话了:

  “这样我就放心了,我还以为卷耳智能科技是傻的,这么机密的东西都敢往外放。原来是假的,那就对了!”

  “也不尽然是假的,小模型肯定不行,但是如果能解决一个最优化理论的问题,用一个新的东西代替这位微模型,那……”

  孙博对前沿理论的研究很深,总觉得类思维模型有点儿意思,而且跟自己思考的一个最优化理论问题有所牵连,说不定这就是他那个问题得到了解决的成功过。

  不过,正敲着字儿呢,他突然反应过来,自己这不是在和同事探讨问题,而是在玩技术论坛。

  这是玩儿High了呀!这东西可不能往外发,也是急忙删除了这段文字,并检查了一番自己的电脑。

  最后回道:“嗯,确实是假的,不过就算是假的,不试一试,你心里不痒痒吗?”

  “还真是!不管真的假的,耳语系统已经事实存在了,怎么来的?不试一试肯定不会甘心的,我先跑跑看,说不定效率虽然低,但是真实效果却非常好呢?数学计算出来的结果不一定就绝对符合事实!”

  “嘿嘿……”

  纪弘笑着,这就是阳谋。

  在自己并没有其他思路的情况下,谁能不去试一试呢?哪怕明知道这是个坑!

  相信英伟达啊、OpenAI啊,尤其是OpenAI肯定会试一试的白白消耗他们一大批算力资源,不管是从哪儿挪来的,那也是好事儿一桩!

  (本章完)

第55章 “平行世界”引擎

  “老公,这都十二点多了。”

  这个时候程荟已经睡了一轮了,半夜醒来之后发现纪弘还不在,也是进来提醒,还端着一杯牛奶:“我给你热了一杯牛奶,喝了赶紧去睡觉。”

  “多谢老婆,嘿嘿,马上!”

  生活眼见着好了起来,公司规模越来越大,挣钱也越来越多,但纪弘半夜加班的日子不仅没少,甚至比之前都还更加的变本加厉了。

  谈了很多次之后,程荟也是跟他定了一个约定:无论如何都不能过十二点。

  “工作是怎么也忙不完的,但身体是自己的,你难道没发现你最近都有点儿力不从心了吗?”

  “哪有!”纪弘立即关了电脑跑去洗手间洗刷睡觉,心里还腹诽着:没事儿老拿这个吓唬我,我从不从心我自己难道不知道吗,也不知道是谁…那啥那啥…也就是这小区隔音还不错……

  看着匆忙跑开的纪弘,程荟也是会心一笑,一个无论身份地位如何变化,在自己面前都是一般模样,一点儿也未曾改变的老公,是真好。

  ……

  一夜无话。

  翌日,纪弘早早的来到公司。

  “纪总,这儿有一份您的邀约,您看如何回复。”刚一坐下,纪弘的行政事务助理就过来传达一份邀约函。

  “英伟达CEO黄仁勋?要来卷耳智能科技?”纪弘思考了一番,决定还是见一见,合作的可能性应该不大这不是两个企业的问题,而是两个国家的问题。

  但这个发明了GPU的人,纪弘还是有一点儿兴趣的:“安排一下,这两天都可以,我都会在公司这边。跟陈总说一声,让他先去负责接待。

  “嗯,对了,也通知一下六楼的张总,他现在也正好在这边,都是老朋友,回头可以一块儿聊聊。

  “好,我马上安排。”

  助理退了出去,然后纪弘把赵东赫喊了过来。

  “APP这边怎么样了?”

  成长引航大模型的训练,有一部分关键数据是通过这个APP来收集提供的,先期考虑有些不周,导致开发启动较晚,没有赶上启动仪式。

  赵东赫这几天也是加班加点:“基本已经完成了,最后的测试也就在这两天。幸亏有代码AI,否则光这APP,即便投入三个团队共同开发,至少一个月的工期也是少不了的。”

  “那还行。”纪弘安排道:“模型的第一轮训练大约需要一周的时间,等第一轮完成了就放开这个APP给200名志愿者,到时候与模型一起边测试边训练边完善边成长。”

  “开发工具这边的开发进度现在怎么样?”纪弘随即问道。

  “啊?”

  “不是催你,我知道,这才不到十天。”

  一周多前,把开发工具的开发工作交给了赵东赫,是未雨绸缪,是为耳语系统脱离Wine的软件生态做的基础工作。

  “吓我一跳!”赵东赫拍了拍胸脯:“开发工具是系统软件,不同于一般软件的开发,而且还要集成代码AI在里边,需求设计就需要不少的时间。”

  “这我知道。”纪弘笑道:“事情有了一些新的变化,那天我跟张建张总沟通,他要去跟游戏开发商谈针对耳语系统和摩尔科技显卡的游戏特别优化。”

首节上一节30/128下一节尾节目录