希望行业内前辈指导:
|  |      1tcper      1 天前 最早期那几篇 transformer 都读不懂? 不过也没事,毕竟不是每个人都要去研发新模型的,你把大模型基本原理搞清楚了,在大厂里负责洗数据,训练,也没啥问题吧 | 
|  |      2icchux OP @tcper 是的。。。不知道是刚开始读的原因,看到一篇文章就很难都进去,不知道在讲啥,之前老师给了一篇 LeNET-5 的文章,也是读了好长时间。至于研发新模型这个没想过,能在大厂负责训练模型调参啥的就不错了。 | 
|  |      3coefu      1 天前 又是人工智能,又是大模型发展方向。你要顺利毕业就找导师给个课题,按照导师的思路搞出来。要整自己的想法,还得沉淀几年先。能力是一回事,毕业和找工作又是另外一回事。 btw ,LLM 还能撑多久都是未知的,并且果实越来越难摘了,加之大家都蜂拥而入,你这个入场时机导致你在读的时候不一定有资源能搞出什么新东西(动不动就万卡集群才可能整出点儿新花样)。 还不如找个小众没什么人关注的领域,先整出点能毕业的先。 | 
|      4Fastmail      22 小时 31 分钟前 放弃吧,llm 作为扩展知识算是加分项,你既不是科班也没有论文或者成果你想找到开发工作难上加难 (我就是公司转型从数开到大模型开发,大模型市场已经饱和,已提离职下份工作还是找数开 | 
|      7tickingMachine      19 小时 48 分钟前 AI 应用开发还是挺有前景的,即便模型能力现在这么强了依然没有“chatgpt”级别的 Agent 产品落地,另外其实很多中小型公司的业务场景中还有很多可以靠接入 AI (大模型/非 LLM 的小模型)来转型提效的需求。 最后还有一个方向就是 AI infra ,比如底层硬件,以及 AI app 的 infra (开发框架等) |