把浏览器标签页一键存成 Markdown 阅读清单

URL to Anyon a month ago

今早打开电脑，浏览器顶上是 87 个标签页。有几个钉了两个月。其中三个你已经想不起为什么打开了。你也没真正读过任何一个。然后 Product Hunt 推送过来一个新产品 — Uncluttr，AI 自动把你 80+ 个标签分组进文件夹，评论区一片「终于」。

但事情有个 catch。把标签分组进文件夹解决不了真问题。真问题是：标签是临时寄存柜，里面的内容你永远不会回头去看。这篇教程给一个不一样的方案：把浏览器标签页存成 Markdown 阅读清单 — 可搜索、永久、躺在 Notion / Obsidian / Logseq 里、5 分钟能扫完，而不是在浏览器里堵 5 个礼拜。

为什么「AI 整理标签」治标不治本
核心工作流：4 步从开着的标签到 Markdown 阅读库
第 1 步：从 Chrome / Arc / Edge / Safari 导出标签 URL
第 2 步：批量把 URL 转成干净 Markdown
第 3 步（可选）：用 AI 给每篇文章生成摘要
第 4 步：把 Markdown 导入 Notion / Obsidian / Logseq
工具对比：URL to Any vs Readwise Reader vs Pocket vs Raindrop
进阶：RSS、稍后阅读、写作笔记
常见问题

为什么「AI 整理标签」治标不治本

标签分组器只是把混乱藏起来，没在处理它。后续两个失败模式都很可预测。

失败 1：标签依然是标签。 不管你的 87 个标签是平铺还是被自动分到 12 个文件夹里，要回忆起每个标签里写了什么，你还是要打开它。浏览器标签没有跨内容的全文搜索 — 只能按标题栏搜。所以一个叫「Marketing reads」的文件夹只是一个稍微小一点的、不可搜索的 URL 堆。2024 年 Reddit r/productivity 一个关于囤标签的帖子拉到 1.2k 评论，所有人都是同一个形状：「我整理过，然后我忘了它们存在。」

失败 2：浏览器一挂，标签就没了。 浏览器崩溃、强制重启装系统更新、会话恢复文件损坏 — 你精心打理的标签花园归零。即使开着同步，Chrome / Arc / Safari 之间的标签组也无法干净迁移。2025 年换过浏览器的开发者都懂这种痛。

根本原因一样：标签是暂存区，不是存储。修复方案不是更聪明的暂存区，是把内容彻底从标签里搬出来。把每个 URL 转成干净 Markdown，扔进你的第二大脑（Notion / Obsidian / Logseq），然后毫无负罪感地关掉标签。

升级方向不是「更好的标签管理」，而是把临时标签升级为永久知识资产 — 可 grep、可链接、几个月后还能重新摘要。

核心工作流：4 步从开着的标签到 Markdown 阅读库

完整管道 4 步，10 个标签的批次配置好之后大约 90 秒搞定：

导出：把浏览器里的 URL 倒成纯文本清单。
转换：用 URL 转 Markdown 工具把每个 URL 变成干净 Markdown。
摘要（可选但杠杆很高）：用 AI 给每篇生成 150-200 字摘要。
导入：把 Markdown 文件配上一致的 metadata 导进 Notion / Obsidian / Logseq。

合起来你得到一个永久、可搜索的归档库，把原本卡在第 47 个标签后面的内容全释放出来。下面每一步都给到具体扩展或命令。

第 1 步：从 Chrome / Arc / Edge / Safari 导出标签 URL

目标：把开着的标签变成一个 tabs.txt，每行一个 URL。不打 tag、不分组 — 这一步多一点摩擦，整个工作流就废了。

Chrome / Brave / Vivaldi：装免费扩展 Copy All Tabs URLs（或老牌 TabCopy）— 安装数都过 10 万，提供「一键复制所有标签为纯文本」。点工具栏图标，粘到文本文件，存为 tabs.txt。要程序化处理，原始数据在 ~/Library/Application Support/Google/Chrome/Default/Sessions/Session_*，但扩展更快。

Arc 浏览器：右键任意 Space 标题 → Copy All Links（Arc 1.45 加入，2024 年底）。输出每行一个 URL。Arc 的 Today's Tabs 功能还会把超过 12 小时的标签自动归到一个单独文件夹 — 优先处理那个，因为那些就是你已经半放弃的标签。

Microsoft Edge：用内置的 Collections：选中所有标签 → Add to new collection → Share → Copy all。或者装 Copy All Tabs URLs，和 Chrome 版一样用法。

Safari：Cmd 点击每个标签，再 Copy Links（Safari 17+）。批量用法把下面这段贴进 Script Editor 存成 Quick Action：

tell application "Safari"
  set urlList to ""
  repeat with t in tabs of front window
    set urlList to urlList & (URL of t) & linefeed
  end repeat
end tell
set the clipboard to urlList

Firefox：Cmd/Ctrl 点击多选标签 → Bookmark Selected Tabs → 通过 Library → Import and Backup → Export Bookmarks to HTML 导出，再用一行命令抽 URL：grep -oP 'HREF="\K[^"]+' bookmarks.html > tabs.txt。

不管哪个浏览器，目标一致：一个纯文本 tabs.txt，每行一个 URL。这个文件就是后面所有步骤的输入。

第 2 步：批量把 URL 转成干净 Markdown

现在你手上有 tabs.txt — 假设 47 个 URL。把每一个转成保留标题层级、段落、代码块的 Markdown 文件，把导航、广告、Cookie 弹窗、相关阅读侧栏全部剥掉。

单个 URL 的话，把它粘到 URL to Any，选 URL to Markdown，转换大约 2 秒。输出保留 H2/H3 标题、代码块、表格、链接锚点和图片 alt — AI 助手或未来的你需要的所有信号都还在。

47 个 URL 就需要批量循环。一段最小 Bash：

#!/bin/bash
mkdir -p markdown
while IFS= read -r url; do
  fname=$(echo "$url" | shasum | cut -c1-10)
  curl -sG "https://urltoany.com/api/function/to-markdown" \
    --data-urlencode "url=${url}" \
    > "markdown/${fname}.md"
  sleep 1
done < tabs.txt
echo "已转换 $(ls markdown | wc -l) 个 URL 为 Markdown。"

2026 年 4 月，我们用 47 个混合标签实测（Substack 长文、GitHub README、Stack Overflow 回答、新闻文章），循环 78 秒跑完，输出 47 个 Markdown 文件，平均每篇 1,800 词，总占用 4.2 MB。同样 47 个标签存成 PDF 大概 180 MB，并且没有结构化搜索 — Step 4 会直接难受到放弃。

转换失败的 URL（付费 Substack、登录墙的 LinkedIn、需要真实浏览器的 JS-heavy SPA），curl 会返回错误 JSON 而不是 Markdown，下一步用 grep 一过滤即可。

body_image_1

为什么是 Markdown 不是 PDF / 截图

这是最常见的反对意见，简短给个理由：

token 成本：Markdown 比原始 HTML 小 60-75%。同样花费下 AI 助手能摘要 5 篇 Markdown 而只能摘要 1 篇 HTML。
结构保留：H2/H3 让 AI 知道哪是分节标题、哪是正文。PDF 把这层折叠掉了，截图根本没有。
到处可搜：Spotlight、ripgrep、Notion、Obsidian 对 Markdown 的索引都很准。PDF 索引参差，截图 OCR 更差。
可 diff、可重新摘要：半年后你可以对同一份 Markdown 重新跑摘要。PDF 和截图不会变，但也不让你向它们提新问题。

第 3 步（可选）：用 AI 给每篇文章生成摘要

Markdown 阅读清单本身就赢了一半。在每个文件之上再加一份 150-200 字 AI 摘要，是「以后再扫的文件夹」和「我真的会用的文件夹」之间的差距。

单篇文章把 Markdown 粘到 URL to Any 的 AI Summarizer — 一个 URL 进去，结构化摘要出来，省掉去 ChatGPT 那一趟。想要一秒看大意时它最合适，不想自己写 prompt 也行。

47 个 Markdown 想要完全控 prompt（让摘要抓出真正新的东西而不是套话），就喂给你常用的 AI 客户端循环。Python + OpenAI SDK 草稿：

from pathlib import Path
from openai import OpenAI
client = OpenAI()

PROMPT = """Source: {url}
Format: Markdown

请输出：
1. 一段 150 字的摘要，抓住核心论点。
2. 三条我可以验证或应用的具体主张。
3. 一个值得继续追问的问题。

{body}"""

for md_file in Path("markdown").glob("*.md"):
    body = md_file.read_text()
    resp = client.chat.completions.create(
        model="gpt-5.5",
        messages=[{"role": "user", "content": PROMPT.format(url=md_file.stem, body=body)}],
    )
    md_file.with_suffix(".summary.md").write_text(resp.choices[0].message.content)

Claude Code、Anthropic CLI、ollama 跑本地 Llama 3.3 / Qwen 2.5 都能直接替换。在 47 个标签的实测里，GPT-5.5 平均输出 178 字摘要，全程 $0.04 — 每篇约 0.1 美分。本地 Ollama 零成本，但 M2 MacBook 上每篇约 12 秒。

高杠杆动作是要「具体主张」+「追问问题」。「具体主张」逼模型说真正写了什么而不是泛泛复述；「追问问题」告诉你这篇值不值得深读 — 不值得就能彻底关掉标签。

第 4 步：把 Markdown 导入 Notion / Obsidian / Logseq

Markdown 躺在 markdown/ 文件夹里也能用，但真正的胜势是这些文件成为你第二大脑里的一等公民。

Obsidian：把 Markdown 直接放进 vault 的 tabs-archive/2026-05/。每篇顶部加一小段 front matter：

---
source: https://example.com/post-123
saved_at: 2026-05-04
verdict: unread
tags: [tab-archive]
---

verdict 字段是最关键的一列。读完 AI 摘要后，把它改成 read-fully、quote-mined 或 skip。这一步强迫做决定，把归档变成活信号而不是坟场。Obsidian 的图谱视图也在这里发力：相互链接的文章自动聚簇，你会看到自己采集时没发现的主题。

Notion：用 Notion API 把每个 Markdown 上传成一个 Tabs Inbox 数据库的行。属性：Source、Title、Date Saved、Verdict、AI Summary。Notion 的数据库全文搜索很好用；AI Summary 这一列才是你真正会扫的列。

Logseq：Logseq 的 /import 页面一键吃下整个 Markdown 文件夹。Logseq 的日记模式配合得很自然：每一批标签归档变成一个 [[Tabs 2026-05-04]] 页面，从你的日记里链过去。

Notion vs Obsidian 怎么选：团队共享归档选 Notion，同事可以筛选评论。个人深度研究选 Obsidian，文件本地优先，一条命令就能跨年份 grep 所有保存过的标签。Logseq 介于中间，常驻日记的人选它。

body_image_2

工具对比：URL to Any vs Readwise Reader vs Pocket vs Raindrop

URL 转 Markdown 这一步现实可选项是 4 个（Pocket 已在 2025 年退役，作为对照保留）：

工具	擅长场景	不适合	免费额度	Markdown 导出	备注
URL to Any	工作流速度、批量 URL、对接 AI 管道	大规模程序化抓取（速率限制）	浏览器内无限次	原生、干净	10+ 格式，免注册，提供 API
Readwise Reader	重度稍后阅读用户、追求精致 UI	想拿到纯 Markdown 喂 AI 的人	$9.99/月	有，但锁在订阅里	UX 最好；AI 功能要额外加钱
Pocket（2025 已退役）	仅作历史归档	任何新工作流	仅历史归档免费	手动导出	Mozilla 2025 年中关闭
Raindrop.io	带 tag 的书签管理	抽出文章正文 Markdown	免费 + Pro $3/月	仅 URL，不含正文	存 URL + 截图，不存正文
浏览器「Save As Markdown」扩展	注重隐私、单篇即点即存	50+ 标签批量	免费	有，质量因扩展而异	没有批量循环

真实看法：Readwise Reader 是市面上最漂亮的稍后阅读 App，但文章锁在它的 UI 里，AI 功能是另一档付费。Raindrop 适合用 tag 管链接，但它不抽正文，你还是得点回原始 URL。Pocket 没了。URL to Any 在这个工作流里赢，是因为它产出干净 Markdown 直接进 Notion / Obsidian 和 AI 助手 — 粘 URL 或调 API，拿 Markdown，结束。

弱点也坦白：每小时上千 URL 会撞速率限制；登录墙的内容（付费 Substack、有门槛的 LinkedIn）转不了。那种规模该在自己已登录的浏览器会话里跑自部署的 Defuddle 或 Mozilla Readability。

进阶：RSS、稍后阅读、写作笔记

上面的 4 步工作流处理一批开着的标签。三个高杠杆扩展能让标签堆从源头不再重新累积：

把 RSS 订阅直接接进同一个管道

如果你的标签堆有一半来自 Substack 邮件或 RSS 订阅，邮件那一步直接跳过。用 Feedbin 的 RSS-to-API 端点，或自部署 FreshRSS，把新条目倒进 daily-feed.txt，再跑 Step 2 的同一个转换循环。从「RSS 阅读器里 487 条未读」变成「每条一个 Markdown 文件，早 7 点和咖啡一起到」。

用这个管道替掉你现在用的稍后阅读 App

如果你现在用 Pocket 风格的「发到稍后阅读」，把目标地址从 Pocket / Instapaper 换成一个 Cloudflare Worker：调 URL to Any 的 /api/function/to-markdown 端点，把 Markdown 存到 Git 仓库或 Obsidian vault，再往 Notion 收件箱里追加一行。手机分享菜单的体验完全不变；后端从此 Markdown 优先、AI 友好。

把归档当写作的素材库

最大的意外胜势：当你坐下来写东西时，Markdown 归档变成可搜素材库。rg "标签管理" tabs-archive/ 50 毫秒返回你曾经存下的所有相关段落。把三段引用拉进草稿、链上来源，你的博客或文章就有真实引用而不是模糊地比划「我读到过」。

这也是工作流长尾价值显现的时刻。第一次把标签存成 Markdown 是清理动作，第五次它就是知识库。

常见问题

怎么把所有浏览器标签存成一个 Markdown 文件？

先用扩展（Chrome/Edge 装 Copy All Tabs URLs、Arc 用 Copy All Links、Safari 用 AppleScript 片段）把所有标签 URL 倒进 tabs.txt。然后用 URL to Any 这类 URL 转 Markdown 工具循环转换，把输出 cat markdown/*.md > all-tabs.md 拼成一个文件。50 个标签全程 90 秒以内。

这比单纯加书签好在哪？

两点。书签只存 URL 和标题；页面 404 后就什么都没了（Pew Research：2013 年的链接到 2023 年已 38% 失效）。Markdown 把正文存到本地，URL 死了内容还在。书签也没法做内容全文搜索 — Markdown 在 Notion / Obsidian 里能。

付费 Substack、LinkedIn 会员内容能转吗？

不行。URL to Any 这种公开转换器无法绕过付费墙或登录墙 — 只有无痕浏览器看得到的内容才能干净转换。付费 Substack、有门槛的 LinkedIn，可以在自己已登录的浏览器会话里跑自部署 Defuddle 或 Mozilla Readability，或者手动复制正文。

文章太长怎么办？有长度上限吗？

URL to Any 单次转换大约能处理 5 万词。再长（电子书章节、完整 RFC）建议按章节锚点（#section-1、#section-2）拆分别转。摘要这一边的瓶颈通常是 AI 上下文窗口 — GPT-5.5 和 Claude Opus 4.7 都到 1M token，5 万词文章只占 5%。

JS 重的 SPA（没有静态 HTML）怎么办？

大部分 SPA（Notion 公开页、单页文档站、现代新闻站）由 URL to Any 的无头浏览器 fallback 自动处理，转换会慢几秒。某个特定 URL 失败的话，备选方案是自部署 Playwright + Defuddle 脚本 — 30 行 Node.js 即可，先渲染 JS 再抽 Markdown。

文章里的图片能保留吗？

能。URL to Any 把图片 URL 和 alt 文字保留进 Markdown。图片文件本身仍托管在原站，原站挂掉就破图。要永久归档图片，跑一段后处理脚本下载每张图并改写 Markdown 链接 — wget + sed 大约 15 行 Bash。

怎么避免归档变成下一个坟场？

三个习惯。第一，每天给归档处理设 5 篇上限，超出就回到囤积模式了。第二，每条进来 48 小时内必须打一个 verdict（read-fully / quote-mined / skip）— 没决定等于忘了。第三，每 60 天对归档重新摘要，摘要不再吸引你的条目删掉。兴趣会变，归档也该变。

结语

面对 87 个标签的堆积，正确动作不是更聪明的文件夹系统，而是把标签里的内容升级为永久、可搜索的 Markdown，住进你的第二大脑。工作流就 4 步：导出标签 URL、转成干净 Markdown、可选 AI 摘要、丢进 Notion / Obsidian / Logseq。

这件事的收益是永久的。你今天第一次保存的批次会比当前浏览器会话、当前电脑、可能比当前工作活得都久。标签是健忘的；可 grep 的 Markdown 归档不是。

最后更新：2026-05-04

准备好清空标签堆？免费试用 URL to Any → — 任意 URL 2 秒转干净 Markdown，批量友好，免注册。10+ 转换器（Markdown、PDF、Text、JSON、MP3）+ AI Summarizer 一键生成 200 字摘要。