开发者需要什么样的大模型

  • 繆斯高
  • 2024-09-20 15:05:57
#开发者需要什么样的大模型# 我做前端开发的时候经常需要找三方库来实现需求,寻找的策略是提供功能尽可能的覆盖需求,然后暴露的自定义接口多,可以高度自定制。这个规律放在AI大模型上依然实用。

首先,模型的参数量不必太多,太多了反而影响训练的过程,其次是性价比,如果学会向上管理的话,肯定要学会花小钱办大事,而Qwen-2.5就可以做到以更小的规模实现更大的效果,简单来说就是72B打405B,在同参数量的模型上,它的价格可以做到很低。

当然,最后还有一个很重要的点就是社区的氛围,对于开源的东西,需要大家来一起维护推动它的进步,同时开发者也能在社区里交流进步,二者相辅相成。 #2024云栖大会#

发表评论