有关垂直和通用大模型最近被问比较多的几个问题

发布日期:2024-09-21 13:17

来源类型:知乎热榜 | 作者:Krow

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【奥门六合论坛】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【澳门管家婆资料正版大全258】【2O24澳彩管家婆资料传真】
【494949澳门今晚开什么】 【2024新澳免费资料】 【75827.cσm查询澳彩资料】

最近参加了几个AI行业的会议,听了一些,也讲了一些。

有关垂直和通用大模型是绕不开的话题,先说我的观点,再针对被问较多的几个问题,讲下我的看法。

观点:

  1. 垂直大模型应该是在通用大模型基座的基础上,增加垂直领域数据,结合业务场景需求打造的,不存在仅使用垂直领域数据打造的大模型;
  2. 根据观点1,垂直大模型的能力80%是由通用模型基座决定的,这也是为什么Llama 2如此受欢迎;
  3. 大部分PR稿讲的垂直大模型还都只是探索期,很少能达到领域可用,且所谓基于大模型的垂直应用,在B端文本类场景中,当下基本都是在尝试复刻以往的应用,真正利用大模型能力的Killer App仍未出现;
  4. 那些通过封装第三方大模型API接口,结合Prompt Engineering提供UI服务的就别说自己是垂直大模型了,顶多算是AI行业裱糊匠,Altman最新的演讲其实也提到了这个观点,套壳OpenAI的公司将来都会被干掉,当下还能赚个信息差的钱。


问题1:

Question 1 : 垂直大模型可谓“百模大战”的新阶段,它离真正的商业化落地有多远?

有些独立开发者做的出海AI应用闷声赚了不少钱,但就以我所在的国内B端企业,文本类服务场景来看,大模型的商业化落地还属于迷茫的探索期。

ChatGPT出现之前的人工智能类项目,几乎都是“人工”的智能,人工在其中的占比很大,大家都做的很累,并且最终效果一般;大模型出来之后,人工智能里面人工的比重是可以明显降低的,但是客户的需求暂时并没有因为技术的改变而发生根本性的变化

面对客户你依然没有议价能力,面对竞对你有的大家都号称有,回头看看成本,算力、数据、算法工程师水涨船高,因此未来3年商业的前景只会更难,大模型是一个长周期的变革,现在还只是万米长跑的开始。


问题2:

Question 2 : 相比通用大模型,构建垂直大模型的难点有什么?它的竞争壁垒又在哪里?

相比通用大模型,垂直大模型对行业数据的理解、答案的正确率、内部系统的协作等有着更高的要求,难点或竞争壁垒有如下四点:

  • 数据语料层面:内部专业数据的获取和处理,有些是行业内独有的数据,存在业务理解、权限划分、隐私安全的门槛;有些是在业务过程中的流程数据,比如OA办公系统内的协同数据。对于这些数据的获取并结合应用场景的清洗提炼,是一个非常复杂的工程;
  • 答案质量层面:大模型的幻觉现象,导致它会编造答案,如何去约束控制输出答案的质量,尤其在金融等合规要求更高的行业,是一个难点;
  • Prompt提示工程层面:众所周知,大语言模型的Prompt输入对输出答案的影响很大,垂直领域需要有对业务和Prompt调优均熟悉的复合型人才;
  • 与内部系统、不同终端的调用:领域大模型的加入可以认为帮汽车换了一个新的发动机,最终为业务端、生产端赋能,还需要与不同的系统和下游任务做交互,并且这种能力的调用最好也是由大模型自主选择,如何在满足权限隔离、能力共用的前提下,实现企业智能化服务的需求,也是垂直领域大模型应用构建会有的难点和挑战。

另外在国内做垂直大模型的落地,还需要考虑当前的国际大背景情况,特别是国产信创的支持,这已经是很多央国企的硬性规定,如果提早兼容国产信创,那么可以增加国内市场竞争力。


问题3:

Question 3 : 幻觉、偏见和思维链局限等大模型固有的问题,在垂直大模型领域是如何被解决的?

幻觉、偏见和思维链局限等这些通用大模型有的问题,在垂直领域只能说用工程的方式做了优化,本质上靠垂直大模型是没法解决的。

比如“幻觉”,可以通过RAG的方案,先通过搜索的方式召回一定数量的上下文,让大模型的答案有来源、有依据,但也仅仅是提升正确率,无法做到避免幻觉,对制造业生产流程、金融的投顾问答等场景,这个准确率远远不够;

“偏见”的话其实跟我们做内容审核的方法比较类似,对于偏见的信息从预训练层面进行清洗,另外在人工对齐层面进行内容生成偏好策略的调整,最后如果安全合规性要求很高的场景,还是需要增加一道人审环节;

思维链一般在足够大参数规模的模型上才会涌现,目前来看垂直大模型还是以百亿为主,对于需要推理计算的工作,建议还是以function call的方式调用外部API来做,而不是依靠思维链的能力。


问题4:

Question 4 : 有一种论点是垂直大模型最终都将回归通用大模型,如何看待垂直大模型和通用大模型之间的竞争关系?

这个问题可以从大模型的功能场景来看,对于孤立的离散场景,比如输入某个指令就可以有特定的输出,和周围的时空以及环境依赖关系不大的场景,包括编写代码、画图、内容转写润色等,一定是会回归内置在通用大模型中。因此像AI女友这一类产品,如果只是单纯的角色扮演,训练不同的人格,或者在UI界面上做优化,那么很容易被替代。

另一类是交互的连续场景,与周围环境的变化、条件的约束息息相关的场景,比如某团做个自己的大模型服务于外卖员调度、商家管理、商品咨询等,这种就没法回归到通用大模型,因为这与企业经营、生产过程相关,需要大模型基于不同企业和环境的感知与洞察进行智能化的思考判断并采取行动,这些能力首先不通用,其次带有企业核心机密,是无法回归通用大模型中的。

因此,两者有各自适用并擅长的场景,但是好的通用大模型基座,会极大提升垂直大模型的能力边界。



以上大部分内容成稿于23年8月,有些技术名词描述(比如之前叫LangChain,现在叫RAG)有些变化,其余基本未改,之前大模型的发展日新月异,有人形容三天不关注,就感觉跟不上要被淘汰,现在大模型领域低垂的果实越来越少,这也说明当下大模型的落地工作进入了爬坡期,大家都更加冷静客观的在看待这一技术。

罗兰LanLaw:

5秒前:这个问题可以从大模型的功能场景来看,对于孤立的离散场景,比如输入某个指令就可以有特定的输出,和周围的时空以及环境依赖关系不大的场景,包括编写代码、画图、内容转写润色等,一定是会回归内置在通用大模型中。

林恩京:

7秒前:对于这些数据的获取并结合应用场景的清洗提炼,是一个非常复杂的工程;答案质量层面:大模型的幻觉现象,导致它会编造答案,如何去约束控制输出答案的质量,尤其在金融等合规要求更高的行业,是一个难点;Prompt提示工程层面:众所周知,大语言模型的Prompt输入对输出答案的影响很大,垂直领域需要有对业务和Prompt调优均熟悉的复合型人才;与内部系统、不同终端的调用:领域大模型的加入可以认为帮汽车换了一个新的发动机,最终为业务端、生产端赋能,还需要与不同的系统和下游任务做交互,并且这种能力的调用最好也是由大模型自主选择,如何在满足权限隔离、能力共用的前提下,实现企业智能化服务的需求,也是垂直领域大模型应用构建会有的难点和挑战。

范子绮:

3秒前:它的竞争壁垒又在哪里?

Dukagjin:

3秒前:有些独立开发者做的出海AI应用闷声赚了不少钱,但就以我所在的国内B端企业,文本类服务场景来看,大模型的商业化落地还属于迷茫的探索期。