2023-08-04 08:41:14 来源 : 东方资讯
(资料图)
文|林炜鑫
编辑|邓咏仪
ChatGPT打了一个共鸣的响指,大洋两岸的AI行业都为之震颤。短短几个月,许多知名人士宣布投身大模型创业,即便有人离AI很远,对大模型一知半解,也愿意拿出令人惊叹的热情和金钱,小步快跑挤进这条赛道。
“仿佛回到了10年前深度学习刚出来那会,”张家兴告诉36氪,“全社会各行各业积极拥抱新的技术。”
近期,36氪专访了这位科学家创业者,他坦言现在是自己职业生涯最兴奋的阶段,“我完整经历过深度学习从学术界诞生到产业界落地的技术周期,现在我感觉在经历第二个技术周期。”
张家兴是粤港澳大湾区数字经济研究院(IDEA研究院)认知计算与自然语言研究中心讲席科学家与负责人。加入IDEA研究院前,他先后就职于百度、阿里巴巴、360等大厂,带领团队进行AI相关的项目研究和技术落地。
两年前,张家兴加入IDEA研究院,开始带领团队做大模型的深入研究,是国内最早一批专注于预训练大模型的团队之一。他带领团队开源了第一个以中文为主的AI绘画模型“太乙”,还创建了名为“封神榜”的大模型开源计划,截止目前共开源超过100个模型。
作为行业专家,张家兴第一时间关注到ChatGPT的发布。他承认最初低估了GPT-3.5所带来的技术突破,直到团队上手体验,他的内心“受到很大的冲击”。
在他看来,颠覆性的变化在于,从过去强调模型结构创新,走向了强调训练方法创新。OpenAI为国内外同行指出一条明路:把通用大模型当作产品,引入更先进的训练方法,一遍遍打磨和调试。因此,训练方法将是大模型生产商的核心竞争优势。
对张家兴来说,大模型创业最难的环节不是资金和算力,而是人才。这不是单纯靠钱能解决的要素。在国内,AI学界和工业界存在一定程度的脱钩,学界诞生的前沿成果往往很难快速应用到工业界。“在青年研究者跟工程师之间,以前大家忽视了一层,是用工程能力做模型的人。”
标签: