Ubuntu 服务器Llama Factory 搭建DeepSeek-R1微调训练环境
文章浏览阅读1.9k次,点赞22次,收藏25次。LLaMA-Factory 是一个强大的大型语言模型微调框架:支持多种模型:涵盖 LLaMA、LLaVA、Mis...
文章浏览阅读1.9k次,点赞22次,收藏25次。LLaMA-Factory 是一个强大的大型语言模型微调框架:支持多种模型:涵盖 LLaMA、LLaVA、Mis...
文章浏览阅读6.6k次,点赞40次,收藏38次。关于671B转译和量化过程中智商降低多少的问题,是一个开放性问题,转译和量化一定是跟原版的智商是有区别的,智商下...
文章浏览阅读858次,点赞6次,收藏5次。因为我们实验室的服务器不能联网,所以glm4部署到docker里面,如果有需要补充的包只能在本地下载好了,再上传到服务...
文章浏览阅读759次,点赞10次,收藏11次。Uvicorn 是一个基于 Python 的快速 ASGI(异步服务器网关接口)服务器。它的主要作用是作为 Web...
文章浏览阅读1.7k次,点赞37次,收藏35次。Deepseek官网老是显示服务器繁忙?显卡闲着不用可惜了,本地化部署Deepseek-R1模型体验独自畅享对话...
文章浏览阅读878次,点赞7次,收藏29次。最近DeepSeek大火,很多人都想用DeepSeek,但是无奈经常提示服务器繁忙,那就试试将DeepSeek部署到...
文章浏览阅读6.7k次,点赞12次,收藏41次。DeepSeek的火爆,不仅让我们看到了国产AI的崛起,也让我们意识到,技术的进步正在让AI变得更加普惠。无论是...
文章浏览阅读1.5k次,点赞38次,收藏14次。Server-Sent Events(SSE)是一种允许服务器向客户端发送实时更新的 Web API。它基于 H...
文章浏览阅读756次,点赞13次,收藏6次。执行ollama run deepseek-r1:32b就可以下载模型,下载完成出现下图这个命令行发送信息的提示就算...
文章浏览阅读850次,点赞11次,收藏18次。安装必要的库:使用 Flask 来构建 Web 应用,同时使用 requests 库来调用 Windows Any...