昆仑万维:天工大模型含金量几何? 天天新动态


(资料图)

今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。

年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。

不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。

“偏科”的大模型

4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。

在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。

对于天工大模型,昆仑万维赋予了它很高的评价。

当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。”

但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。

4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。

例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。



而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。 ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。


图片来自网络

另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。

例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。


图片来自网络

不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。

在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。


图片来自网络

针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。”

布局AI已三年,但相关专利难寻

一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面显得过于沉默。

根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与其合作公司奇点智源的身影。


图片来源:IPRdaily中文网 数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利

实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。

和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。

大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。

事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。

2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。

就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。

到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。

再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。

消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。

监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。

字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。

财务状况能否支撑巨额研发?

在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。

大模型的研发与迭代是毫无疑问的“烧钱”游戏。

单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。

在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。

在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。

如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。

对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。

这些研发投入及在手现金,在风起云涌一日千里的大模型赛道,恐怕难以支撑昆仑万维的野心。

研发投入不足,是否会造成公司在激烈的行业竞争中处于劣势?对于这一问题,昆仑万维在给和讯网的问题回复中也并未直接回答,只是回复称,投入方面,昆仑万维有健康的现金流,作为昆仑万维三大业务板块之一,公司将继续加大相关投入,不断迭代升级模型算法,努力保持领先优势。同时探索新的商业模式,不断拓宽行业边界,并加强战略伙伴间协同合作,为公司新一轮高速增长注入动力。

今年的业绩交流会上,昆仑万维CEO方汉称“我们从2020年开始投入大模型研发,2022年提出allin AIGC的口号,所以公司管理层AIGC的认知非常超前,我们在B端和C端和算法演变上有很信心,在长期中我相信我们会处于第一梯队。”

但据中国移动研究院最新报告,业界普遍公认国内大模型第一梯队当属百度、阿里巴巴、腾讯、华为四家,在大模型研发投入、技术能力和人才团队实力较强,具备追赶GPT-4实力。而对于中国AIGC的未来,更有一线投资人直言,中国一定会有自己的ChatGPT,但中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为,创业公司或者那些纯为了炒股价的A股上市公司很难有机会。

因此,无论是从大模型的实际能力还是业内认知,昆仑万维想成为AIGC领域的第一梯队,都有很长的距离要走。

关键词: