在 LLM 中,为了获得一个好的 basemodel,往往都会使用 pre-train 的方式。但是通常 pre-train 都需要消耗很多资源,不管是算力还是数据。其实除了 pre-train 之外,还有一种方案叫做 continued pre-train,这篇文章会简要介绍一下这种方案。
Share this post
如何做 continued pre-train
Share this post
在 LLM 中,为了获得一个好的 basemodel,往往都会使用 pre-train 的方式。但是通常 pre-train 都需要消耗很多资源,不管是算力还是数据。其实除了 pre-train 之外,还有一种方案叫做 continued pre-train,这篇文章会简要介绍一下这种方案。