
文章来源: 更新时间:2025-01-04 21:50:08
我记得之前一个搞石油的,也说搞了一个大模型 然后参数也就0.x b 这种,感觉还是过拟合出来的,后续做了无数处理让其能干活。
也不给看模型具体结构,我猜他们也不可能真的做新的架构,估计是还是 Transformer 这些,因为数据保密,他们肯定不能开源 现在说大模型的,实话说,“大”不是指参数规模,而是指用了 ”Transformer“ 就是大,你用 100 层 lstm 都叫小,你用两层 Transformer 都敢说自己是搞大模型的,也没人能查你的真…。
地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567
版权所有: