能匹敌GPT3.5的团队,默默无闻的驻扎在西湖边_当前看点
导语:过往的产品打造已经验证了西湖心辰的商业潜力,与 OpenAI 相似的人才与理念,也让其在打造中国版GPT的道路上,具备了更加坚实的基础。
上月月底,完成百度风投领投的Pre-A轮融资后,西湖心辰(杭州)科技有限公司(以下简称“西湖心辰”)近日再获汤姆猫(300459.SZ)战略投资。
产品全球用户基数庞大,月活跃用户超4亿的汤姆猫,之所以会选中西湖心辰,是因为看中了其领先国内的大模型研发水准及其有长期记忆、情感感知和主动聊天的特色。
(资料图)
凭借着顶流的技术团队、多模态的技术优势,这个默默无闻的低调企业,不仅打造了国内极少数能与GPT-3.5一较高下的大模型,还多次赢得了360周鸿祎、美团王慧文的青睐。
如今,汤姆猫将成为西湖心辰团队外的最大外部股东,凭借本次投资,双方将在多模态大模型、通用人工智能垂直领域模型及终端硬件等交互产品领域开展深度合作并快速落地。
将“会说话的汤姆猫”升级迭代成有记忆、有情感、能主动聊天的汤姆猫,将应用场景从游戏拓展到教育、智能硬件、智能家居入口。
01 低调的顶流团队
虽然在目前这场追逐GPT的热潮中,不少企业都立下了赶超 OpenAI、打造「中国版 ChatGPT」的豪言壮志,其中就包括了「西湖心辰」这家创立时间不到两年的公司。
那么,为何这家如此年轻的企业,敢夸下这样的海口?
最重要的原因,恐怕就在于,这支低调的团队,拥有国内几乎最顶尖的研究力量
西湖心辰的创始人蓝振忠,不仅身为卡内基梅隆大学(CMU)的人工智能博士,还在Google人工智能研究院担任科学家期间,主导研发了谷歌大模型BERT的轻量化版本:ALBERT(学术引用4600+),大模型领域颇有影响力。
目前,蓝振忠的相关研究已应用在Google News和Google Assistant等覆盖数亿用户的产品中,同时,蓝振忠还是国内目前极少数有实际使用数千张GPU训练出大模型经验的科研工作者之一。
「西湖心辰」团队的核心成员,既有来自Google、Meta、Amazon等公司的高管和科研专家,覆盖了大模型的架构、训练、推理等关键环节。也有在应用层面深耕人与AI交互、自然语言处理,并颇具技术经验的实干型人才。
可谓建立了一套从理论到应用层面的完整人才体系。
这支高人才密度的团队,为西湖心辰带来了深厚的技术实力和前瞻性。
更重要的是,西湖心辰背靠中国新型研究型大学西湖大学,拥有丰厚的人才储备和强大的算力资源,此前,西湖大学就曾利用大规模 AI 集群成功解析新冠病毒的受体—— ACE2 的全长结构,此成果登上 Science 封面,推动了抗疫药物的研发。
如此雄厚的技术实力,无疑为西湖心辰打造“中国版 ChatGPT”的道路奠定了基础。
02 匹敌GPT-3.5?
汇聚了国内顶尖AI人才的西湖心辰,专注于大模型的研究和应用,秉承提升通用大模型能力,推进上层应用智能化的认知理念,构建了模型层—中间层—应用层的产品架构。
凭借着过硬的技术积累,他们在大模型的研究和商业化落地方面,领先国内其他创业团队一年,已经积累了超过百万的用户,并且在模型层,训练出了匹敌GPT3.5 千亿级参数的语言大模型RIO。
按照模型参数量大小,RIO系列现在已有十几个成员,参数量从100多亿到1000多亿不等,支持中英文双语,除了记忆外,还掌握了搜索引擎、知识图谱、外部数据等认知工具调用能力。
通过一个收集的用户如何用大模型的通用题库(该方法与GPT3.5的评估方式相似),西湖心辰把RIO模型与GPT3.5做了比较,发现130亿参数的RIO模型可以达到类似于GPT3.5的效果,即标注者无法分辨出哪一个更好一些。
当通用模型预训练完备后,垂直领域的高质量数据是持续迭代的基础——在获得数据之后,调优功能会让模型更智能。
目前,RIO大模型在处理非结构化数据的能力上有了极大提升,过往在企业内部沉淀下来却未被充分利用的数据,将在大模型赋能下展示出更多价值。
在这一产品架构下,终端应用和底层大模型的联动十分紧密。
蓝振忠表示,西湖心辰推出应用时,会依据应用的难度和需要推理的速度选择合适的模型,再通过该应用相关领域的数据进行调优。模型的能力也会直接影响的整体效果。
在大模型数据质量日益提升的情况下,各种基于应用层面的具体产品,也就应运而生了。
03 多模态的试水
在应用层面,西湖心辰目前围绕着心理、绘画和写作方面,推出了三款产品,并已积累了数百万用户。
它们分别是:
心理咨询小程序——聊会小天。
AI写作小程序——Friday快写宝。
AI绘画小程序——造梦日记。
1.聊会小天
2020年,刚回国发展的蓝振忠,遇到了突如其来的疫情,面对疫情造成的不安、焦虑,蓝振忠意识到,AI在解决社会心理需求方面,也能发挥重要作用。
于是,蓝振忠迅速组建了一支科研队伍,着手研发AI心理咨询平台,想要打造一个更普惠、智能且专业的AI心理咨询平台。
目前,AI心理咨询平台小天,已经和多个医院开展合作,接访了来自全国各地的咨询者近2万人,并通过获取的真实的、高质量的数据集,加速产品迭代,为用户提供深度情感陪伴。
2.Friday快写宝
凭借着自主研发的创新性AI算法和对Google搜索引擎偏好的了解,FridayAI开发了60多种不同的写作模板,以及100多种可定制的写作场景。
选择模板后,只需要输入关键词,就能有针对性地生成独特、原创且高质量的文案。
凭借着强大的文本生成技术、AI编辑能力,Friday快写宝能满足电商、新媒体、短视频等多个领域,多种文风的不同文案。
从而极大地提升了企业的出稿效率。
3.造梦日记
西湖心辰在2022年8月推出的AI画图产品“盗梦师”(现已改为“造梦日记”), 目前积累了超过百万 C 端用户,数十家 B 端用户。
经测试,造梦日记生成的AI绘画速度仅在3秒之内,而市面上其他平台的出图速度则在几十秒甚至一两分钟左右。
这样的快速反映也是得益于西湖心辰在AI领域多年的技术,以及西湖大学实验室的成熟算力。
除了出色的生成速度,造梦日记也针对诸如漫画、内容营销等专业用户开发了会员版,涵盖了丰富的专属模型,也可以自定义自己的画风,从而满足了多样化的绘画需求。
04 在地上拽着AI的风筝
如果说,OpenAI的成功,让ChatGPT成为了引爆AGI(人工通用智能)万里征程的第一个爆点,那么接下来最有可能的爆点,就是AGI沿途所涉及的各种应用。
因为再先进的模型,再出色的算法,终归还是要满足社会的真实需求,才能真正生根发芽。
而西湖心辰创始人蓝振忠,以突出的国内外学术与产业融合的积累,赋予了西湖心辰立足多模态大模型,穿透模型层、中间层以及应用层的布局战略。
虽然语言大模型的投入更大,但当用户足够多,数十亿的成本平摊下来,几乎可以忽略不计,跟高速的建设是一个逻辑。
而对于写作、绘画这类各行业都有着巨大需求的“泛用”技能,西湖心辰则下足了领域细分的功夫,满足了多业态,多层次群体的需求。
如文本生成的应用场景覆盖营销文案写作、邮件写作、办公写作、论文写作、短消息回复等等用途,不仅更专业,也更“体贴”。
而其推出的AI绘画工具,也最大程度地兼顾了普通、专业、B 端、甚至小 B 端群体的使用需求。
过往的产品打造已经验证了西湖心辰的商业潜力,而与 OpenAI 相似的人才与理念,也让其在打造中国版GPT的道路上,具备了更加坚实的基础。
正如Sam Altman 不一味坚持技术理想主义,引入微软,平衡了技术发展的需求与商业转化的目标,并最终成就了ChatGPT一样,
当前中国AGI的发展,也需要像西湖心辰这样,在地上紧紧拽着人工智能这个风筝,将之与世间各种需求紧密相连的企业。