Skip to content

AI 资讯日报:2026-06-28

岗位趋势

Meta 要求员工更高效使用 AI token

据 FT / The Verge,Google 限制 Meta Gemini 用量后,Meta 已要求员工更高效使用 AI token,并将负载迁移至内部 Muse Spark 模型。大型厂内工程师日常 Cursor/Copilot 用量可能受配额与内部模型切换影响。

来源: The Verge

Forward Deployed Engineer:裁员潮中少数高增长岗位

Business Insider 援引 Indeed:FDE posting 同比约 +729%,Layoffs.fyi 同期记录 10 万+ tech 裁员。对前端/全栈的启示:纯页面交付岗承压,能把 AI 接进客户生产环境的「最后一公里」岗位仍在扩招。

来源: Business Insider

行业动态

算力短缺:从 hyperscaler 到 enterprise 的全面瓶颈

Google 限 Meta Gemini 之外,报道指 多家 Google Cloud 客户受不同程度影响,Meta 因需求量「exceptionally high」受冲击最大。行业共同现象:芯片、数据中心、电力投入数十亿美元仍难匹配 surging AI 需求。 解释 Gemini 3.5 Pro 延期、GPT-5.6 分阶段发布、企业 token rationing(见 6-24 TechCrunch)的共同底层约束。

来源: The Next Web

政府 frontier 模型审批:行业集体行动压力

政府 frontier 模型审批:行业集体行动压力

评论指 OpenAI 与 Anthropic 需从「安全与监管是竞争优势」转向行业集体行动,建立可重复 pre-release 审查;否则每个 US lab 的 frontier 发布均面临非正式 veto。Trump 6-2 EO 要求 30 天预览的「自愿」框架仍无实施细则;8 月 cybersecurity EO deadline 临近。

来源: TechCrunch

Reid Hoffman:xAI「complete train wreck」等(社区信号)

LinkedIn 联合创始人 Reid Hoffman 据 secondary 源称 xAI 为「complete train wreck」,并指 Cursor 可能已过峰值——属社区/个人观点,非官方声明。

来源: AIToolsRecap 汇总

热门项目

AlexsJones/llmfit

AlexsJones/llmfit

Rust 终端工具,检测 CPU/GPU/内存并推荐本地可运行 LLM;支持 Ollama、llama.cpp、MLX、vLLM、LM Studio;`llmfit recommend --json` 可接入 OpenClaw skill。

来源: HelloGitHub Vol.123

THU-MAIC/OpenMAIC

THU-MAIC/OpenMAIC

清华 THU-MAIC 团队开源多智能体交互课堂——一键从主题/文档生成沉浸式课程,AI 教师与同学实时讲授、讨论、白板绘图、TTS;可导出 PPT/HTML;集成 OpenClaw 从飞书/Slack/Telegram 生成课堂。

来源: THU-MAIC/OpenMAIC

vllm-project/vllm-omni

vllm-project/vllm-omni

vLLM 官方多模态推理与服务框架,扩展图像/视频/音频输入输出,支持 DiT 等非自回归架构;stage graph 解耦任意到任意多阶段 pipeline。

来源: vllm-project/vllm-omni

FareedKhan-dev/train-llm-from-scratch

FareedKhan-dev/train-llm-from-scratch

纯 PyTorch 从零实现 Transformer → 预训练 → SFT → Reward Model → PPO/DPO/GRPO 全链路(无 trl/peft/transformers),含 Streamlit UI 与 MkDocs 文档。

来源: FareedKhan-dev/train-llm-from-scratch

DietrichGebert/ponytail

DietrichGebert/ponytail

AI coding agent skill/plugin,用 6 级「懒惰阶梯」(YAGNI → stdlib → platform → 已有依赖 → 一行 → 最小实现)抑制 over-engineering;作者 agentic benchmark 称约 54% 更少代码、20% 更低成本、27% 更快(安全项不降)。

来源: DietrichGebert/ponytail

HaujetZhao/CapsWriter-Offline

HaujetZhao/CapsWriter-Offline

Windows 完全离线语音输入,按住 CapsLock 说话松开上屏;支持热词、LLM 润色、音视频转字幕;可 U 盘即插即用。

来源: HaujetZhao/CapsWriter-Offline

XiaoLuoLYG/GOD

XiaoLuoLYG/GOD

Govern, Observe, Direct——local-first 多智能体像素小镇模拟,支持暂停/回放、向单个或全体 agent 提问、实时注入干预指令、浏览器无代码配置。

来源: XiaoLuoLYG/GOD

产品更新

Google 限制 Meta 的 Gemini 使用量

据 FT 援引知情人士,Google 约 2026 年 3 月 告知 Meta 无法提供其希望采购的全部 Gemini 容量,已对 Meta 等多家客户实施使用上限;Meta 部分内部 AI 项目因此延迟。Meta 已要求员工更高效使用 AI token,并将更多工作负载迁移至内部模型 Muse Spark(Superintelligence Labs)。Google、Meta 均未回应媒体置评请求。 罕见公开的大客户被 rival cloud 限流案例,说明 frontier 推理产能已成为比模型 benchmark 更硬的约束;加速 Meta「…

来源: The Verge

Anthropic Mythos 5 恢复:媒体跟进与 Fable 5 真空

6-26/27 Lutnick 信函后,国际媒体继续报道 Mythos 5 向「小型美国网络安全公司与基础设施运营商」恢复访问;Fable 5 仍不对公众开放,Anthropic 称继续与政府谈判扩大 Mythos 并恢复 Fable。

来源: The Star

模型发布

(本日无新条目)

论文研究

(本日无新条目)