目标
- 一个写作助手, 需要在一个方向写出专业分析文章
- 专业分析新技术, 而不是写出新技术, (写新技术, 新应用的优缺点/应用点/所需条件等)
需求:
- 数据库要新, (GPT-4, 最新是 2023 年 4 月, 这样不符合要求, 要足够新, 例如近期的文章都需要加入)
- 限定行业或者方向, 缩小范围 (例如半导体, 新能源等等最新技术分析文章, 期望小而精, 例如锂电池一个库, 氢能源一个库, 都可以分开, 或者应该合并更好)
方案选择(问题)
- 现成的服务平台提供类似的,(目前没看到), 我们自己提供最新文章, 然后生成一些想要的文章
- 自己训练, 如果自己训练是不是可以考虑直接 京东买一块 4090D + 合适的模型 (零基础, 平时写 Go+Python, 后端, 立刻开始试试. 虽然看到 2080ti 22g 性价比, 但是想省时省事一些,还有售后)
- 如果自己训练, 数据集是不是分割越小越好.例如 氢能源单独一个.
模型选择
- Chinese-Mixtral-8x7B (今天 twitter 看到 https://github.com/HIT-SCIR/Chinese-Mixtral-8x7B )
- 34B-Chat (V2ex 看到, @ShadowPower 推荐的 https://www.v2ex.com/t/1004201#reply43 )
- RWKV-Runner ( 也是 @ShadowPower 推荐, https://github.com/josStorer/RWKV-Runner )
显卡
看到有货, 可以买了, 目前能自营买到最好的显卡了吧. 特供版本
七彩虹( Colorful ) iGame GeForce RTX 4090 D Advanced GDDR6X 24G 大显存 游戏电竞电脑显卡 ¥ 13999.00
https://item.jd.com/100081721839.html
谢谢