1285 字
6 分钟
YOLO 开发日志(一):为什么要开发 YOLO

首先,你可能会好奇,为什么这个项目要叫 YOLO(You Orchestrate, LLM Operates)?

其实后面那串全称是我先射箭再画靶子硬凑出来的()

主要还是因为——YOLO这个名字确实很好玩啊!而且,Trae 的 Agent 模式也叫 yolo,那个深度学习必学的视觉模型也叫 yolo ,我直接neta过来,岂不是从最开始就降低了教育用户、培养用户心智的成本!

我可太聪明了.jpg

事情其实是这样的:我最开始还是Smart Composer的忠实用户,但很快我就有点忍受不了它了。

是的,我知道Obsidian用户个个都是精通coding的工程师型全能码农,用户用不舒服了会自己跑会自己去fork改代码的,插件写的比较复杂也是因为geek们喜欢一切尽在掌握。

但我总还是觉得,作为一款AI插件,应该是有理想的,要尽量的用户友好,配置上不要那么反直觉,支持 i18n 多语言切换也该是标配……

于是,我在六月份给 Smart Composer 提了一份自定义助手(custom agent)的PR,不过也许是我写得太烂,也许是维护者太忙,导致好几个月我的PR一直都没啥进展(尽管SC的主要维护者说要尽快看看)

终于,我忍不了了。

我决定自己动手,fork Smart Composer,照着我的理念彻底魔改一番。

所以,就有了你现在看到的 YOLO

这里要专门感谢 Windsurf 里的 Claude 4.1 opus、GPT5 medium 和 Claude 4 sonnet 老师,没有你们就没有 YOLO。

YOLO的愿景是什么?#

市面上已经有很多 AI 对话插件了,那些前辈们在 ai 插件领域方面的探索是令人敬佩的,没有他们的探索/基建就没有现在的 YOLO。

但在我看来,仅仅只是把聊天框塞到聊天框,还远没有发挥出大语言模型在知识管理领域真正的潜力。

我们使用 Obsidian 的核心目的是什么?

是为了管理、连接、重构我们原本的知识体系,是为了让我们所记录的段落可以真正被内化到我们的大脑中。

YOLO 想要做的,就是让 LLM 成为你知识管理的「第二大脑」—— LLM 可以做的绝不仅仅是简单地回答问题,它们可以主动帮你梳理思路、建立连接、激发灵感;LLM 驱动的 Agent 可以在笔记后台帮你处理各种重复性的打标、总结、搜集信息的活动,它还可以成为你的私人教师/投研助理/学术搭档……

正是因为 LLM 具有这样的潜力,所以我不希望它仅仅是一个需要你手动调用的工具,而是能够智能地融入你的知识工作流,成为你思维过程的延伸。

想象一下:当你正在写一篇学术论文时,YOLO 可以自动扫描你的文献笔记,帮你归纳不同研究间的异同,甚至生成初步的综述草稿;当你整理日常记录时,它能够识别出潜在的主题关联,并建议你将相关笔记进行合并或建立双向链接;当你陷入创作瓶颈时,它能够从你的过往笔记中挖掘出隐藏的灵感线索,帮你重构思考路径。

YOLO 的设计目标,就是让这些场景变得简单、自然,可以以一个相对较低的成本进行人机协同,让 LLM 成为我们知识探求中的好伙伴。

我希望 AI 可以真正理解我们的知识结构和工作习惯,可以在需要的时候恰到好处地提供帮助,而不是频繁打断你的心流状态。比如,通过设置自动化的 Agent 任务,你可以让 YOLO 在后台定期整理未分类的笔记、提取关键信息生成摘要,或是根据你设定的规则自动打上标签——这些原本繁琐的操作,现在都可以交给 LLM 悄然完成。

在未来的版本中,我计划参考 Claude code、kilo 等业内极为优秀和值得敬佩的先行者们的思路,在 Obsidian 里实现一个基础、灵活且通用的 Agent 框架,并在这个框架基础上去实现一些很有趣的想法:如比 Notebooklm 更灵活的学习模式 ,思维画布式的头脑风暴界面,多 AI 交互式写作、讨论的大模型圆桌会议等等。

我相信,当人类创造力与AI能力真正融合时,我们能创造出的价值将超乎想象。

如果你也同样拥有对创作流程的强迫症 —— 如果你也一样在 Obsidian 里混迹多年却始终觉得AI 写作插件少了点什么 —— 那么,欢迎来试试 YOLO,说不定这里会是你想找的答案。

我们下篇日志再见 :)

YOLO 开发日志(一):为什么要开发 YOLO
https://www.lapis.cafe/posts/ai-and-deep-learning/yolo/yolo-releasenote-01/
作者
时歌
发布于
2025-10-05
许可协议
CC BY-NC-SA 4.0