北京时间10月13日,AI大神、OpenAI创始成员之一Andrej Karpathy在GitHub上开源了他的nanochat项目,短短一天时间就收获了上万Star! 他称这是他写过最疯狂的作品之一,仅用100美元,8000行手搓代码即可训练出能进行基础对话、创作故事诗歌、回答简单问题的简易克隆ChatGPT。 nanochat是一个极简、从零开始的全栈训练/推理 pipeline,涵盖分词器训 ...
访问显示的 URL(比如 Lambda 上是 http://209.20.xxx.xxx:8000/),就能像使用 ChatGPT 一样与你的模型聊天。
需要注意的是,由于目前对强化学习(RL)的支持还不太完善,在计算总耗时时把它排除了。到监督微调(SFT)阶段为止,整个过程运行了3小时51分钟, 总成本为(3+51/60)×24=92.4美元 (如果加上强化学习,现在总时间会更接近5小时)。
整体成本只需约100美元 (在8×H100上训练4小时),就能训练复刻出一个可进行基础对话、创作故事诗歌、回答简单问题的简易版ChatGPT模型。 举个具体的例子:一个深度为30的模型训练24小时后(相当于GPT-3 Small ...
本项目是一个基于 FastMCP 的全网短视频去水印解析服务,支持多平台视频分享链接的解析,自动提取视频真实地址及相关信息。 适用于需要批量解析、去水印、采集短视频的场景。本项目还支持视频内容文本提取功能,可以通过语音识别将视频内容转为文本。
InfoQ中国 on MSN
一场“垃圾堆积问题”的AI数据漂流
随着城市人口激增与基础设施日趋复杂,海量治理事件与跨部门协同需求交织,城市治理传统人工处置模式已难以应对效率与精准度的双重挑战。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果