把抖音视频变成永久笔记:手把手教你用「dy-note」沉淀碎片化内容

在这个短视频极度碎片化的时代,我们经常遇到一个尴尬的情况:在抖音刷到一个非常有干货的教程或者观点,当时觉得“学到了”,但过几天想回过头来找时,要么淹没在信息流里根本找不到,要么视频已经被删除或限流。

之前我分享过如何把 B 站视频变成 Markdown 学习笔记,很多朋友在后台私信问我:“那抖音行不行?”

虽然它们都是视频平台,但底层数据结构完全不同,所以没法用同一套逻辑搞定。于是,我专门为抖音写了一个新的 Agent Skill——dy-note。今天就来聊聊这个工具,以及它如何帮你从算法推荐的黑盒中夺回知识所有权。

什么是 dy-note?

简单来说,dy-note 是一个给 AI Agent(如 OpenAI Canvas、Claude Artifacts 或各类 Client 端)使用的插件。它的核心功能非常单一但高效:将抖音视频、评论区、账号主页以及话题内容,一键“榨干”并整理成本地 Markdown 笔记。

它不只是简单地粘贴文本,而是会做几个关键动作:

dy-note AI Agent Skill 界面演示

dy-note 的实际操作界面,展示如何通过 Agent 指令提取视频内容。

  1. 提取字幕与画外音:自动抓取视频中的所有字幕和语音转文字内容。
  2. 评论资产化:提取评论区的精华内容,单独存储为可用资产。
  3. 结构化存储:生成标准化的 Markdown 文件,方便导入 Obsidian、Logseq 等双向链接笔记软件。

特别是第 2 点,非常有用。这意味着你可以针对视频内容继续向 AI 提问,而 AI 可以直接引用评论区的数据进行佐证或扩展分析。

实战演练:从零开始提取

下面以我在 QoderWork 里的真实使用场景为例,演示一下整个流程。无论你用的是哪种 AI 客户端,只要支持上传 Skill 或配置 Codex,逻辑都是通用的。

第一步:安装与配置

这个项目是完全开源的(GitHub: Rimagination/dy-note)。你需要做的是将项目中的代码包或配置文件上传给你的 Agent。

  • 确认你的 Agent 环境支持 Python 或对应的依赖库。
  • 将 Skill 配置文件导入,Agent 就会理解如何处理抖音链接。

Python 环境配置示例

配置 AI Agent 环境以支持 dy-note 插件的示意图。

第二步:数据提取

这是最核心的一步,也是技术实现的难点所在。抖音对爬虫的限制比较严,但通过该 Skill 的中间件处理,我们可以绕过大部分限制。

你只需要发送指令:“提取这个抖音链接的内容”,Agent 就会开始工作:

  1. 识别链接中的视频 ID。
  2. 请求视频元数据(标题、作者、发布时间)。
  3. 抓取字幕文件(有些视频是硬编码字幕,有些是软字幕,工具会尝试匹配最清晰的可读文本)。
  4. 提取评论(这一点很多人询问,下面细说)。

第三步:导入 Obsidian(可选但推荐)

生成 Markdown 后,你可以直接复制到你的笔记软件中。如果你是 Obsidian 重度用户,配合 Templater 或 Dataview 插件,效果会更好。

  • 双向链接:笔记中会自动包含视频作者、话题标签等元数据,方便在知识库中建立横向联系。
  • 本地归档:再也不怕视频原主删号了,核心内容已经落在你的本地硬盘。

关于评论提取的实测反馈

Obsidian 知识库界面

将提取的抖音内容导入 Obsidian 形成双向链接笔记的效果图。

在上次分享 B 站工具时,就有朋友问能不能把评论也一起扒下来。

结论是:当然可以。

但在实际使用中,如果是一两个赞的视频还好,如果是几十万赞的“爆款视频”,评论区的数据量是巨大的。如果全量拉取,不仅耗时长,而且容易触发反爬限制,更别提后续让 AI 消化这些海量的垃圾信息了。

解决方案:

dy-note 默认设置了只提取前 100 条主评论(不含楼中楼)。这个量级通常覆盖了 90% 的核心观点和高质量反馈,且处理速度极快。

  • 如果你是普通用户:保留默认设置即可,足够用了。
  • 如果你是做舆情分析或学术研究:可以通过修改参数(在 Prompt 中明确指令“提取全部评论”)来开启全量模式。但这需要更长的等待时间和可能面临被风控的风险,请酌情使用。

为什么我们需要这种工具?

现在的互联网内容越来越像“流媒体”,即看即焚。我们在抖音上花费了大量时间,但留下的东西很少。

评论数据提取过程

dy-note 在处理热门视频评论时的数据流示意图。

使用这种工具,本质上是在进行**“数字资产私有化”**。把那些属于公共领域、随时可能消失的碎片信息,转化为属于你个人的、可检索、可复用的知识库。

不需要重复造轮子,也不必忍受广告的干扰。只要配置好,你就拥有了一个强大的私人视频剪辑助理和知识整理员。

希望这个重发的内容能帮到大家。如果你在使用过程中遇到报错或者无法解析的情况,欢迎在评论区交流(这次我是真的纯手打回复,没有用 AI 润色,大家轻喷)。

开源不易,且用且珍惜。

GitHub 开源项目主页

dy-note 项目在 GitHub 上的仓库页面,欢迎开发者贡献。

数字资产私有化概念

将碎片化互联网媒体转化为个人数字资产的流程图。

标签: none

评论已关闭