互联网江湖认为,大模型的发展会经过三个阶段。 第一阶段,模型数据、数据为核心的技术驱动阶段。 从ChatGPT 到GPT阶段,大模型是由技术驱动,这时候关键是算法,和数据训练。 GTP之后,差距就在于数据量,这不难理解,这好比是一个有着超强学习能力的孩子,在咿呀学语之前,进步不大,一旦掌握了世界的数据语言,那么大模型的进展是飞速的。 而做通用大模型的玩家,需要尽快度过这个阶段,并建立自己的核心优势。
目前来看,百度文心、腾讯混元、阿里通义千问、商汤大模型、以及讯飞火星等,国产主要大模 摩洛哥电话号码数据 型都走到这一阶段。 这些大模型,都是大公司做出来的,能走到这个阶段的大模型,要么算法更先进,要么有足够的数据参数和训练量。 以百度为例,月份上线的文心大模型,能力已经超出ChatGPT ,虽然官方没有公布具体的数据量级,但大量的数据、算法优化训练是必经之路。 这个阶段,拼的其实就是硬实力,拼的是数据生态,人才技术和资金投入,创业公司很难真的从底层做起来。
第二阶段,是产品驱动阶段。 当国产大模型不断涌现,百模大战的格局上演之后,行业其实就已经走到了产品驱动阶段。 产品驱动阶段,百模大战会经历一轮淘汰赛。 大模型从业者普遍认为, 亿亿参数量级是模型能力质变的门槛。 换言之,对于资本市场来说,百亿参数量级之前,一些大模型项目很可能会首先遇到生存问题。也就是说,对于一些后来者、在遇到生存问题之前,必须要有足够应用落地。 也因此,产品阶段的大模型,核心在落地场景。
|