一句话说清楚这个项目是干什么的

有个 GitHub 项目叫 mvanhorn/last30days-skill,一天涨了 37k Stars。它的核心能力是:你给我一个主题,我帮你把 Reddit、X(Twitter)、YouTube、Hacker News、Polymarket(预测市场)和通用 Web 上过去 30 天的相关讨论全部抓回来,然后让 AI 写一份带来源的综述。

听起来是不是很耳熟?有点像 Perplexity 的“焦点模式”,但这里是可本地跑的 Agent Skill,你可以控制数据源、时间窗口和输出格式。

它解决了什么实际问题

作为技术开发者,我经常需要快速了解一个新方向(比如“近期 AI Agent 的热点讨论”、“MCP 协议的最新争议”),但手动搜索效率极低:

  • Reddit 上有技术讨论但太散
  • X 上有大V观点但时效性高、噪声大
  • YouTube 有深度视频但得看十分钟
  • Hacker News 有热帖但权重偏向英文
  • Polymarket 上甚至有人赌“某产品会不会死”

把这些全部看完再汇总,至少要两个小时。 Last30Days 就干一件事:交给 LLM 去并行扫描,然后合成一个带引用的摘要。

核心设计:为什么选这六个数据源

项目 README 没细说理由,但我分析下来,每个源都有独特价值:

数据源 价值点 典型用途
Reddit 技术社区长尾讨论,能找到“普通人真遇到的问题” 产品吐槽、使用技巧
X 实时热点、大V动向、官方公告 行业风向、突发新闻
YouTube 深度教程、产品演示、会议演讲 学习资料、竞品分析
Hacker News 技术大牛与创业者的高信噪比讨论 技术趋势、开源项目评价
Polymarket 预测市场合约,反映“群众对未来的赌注” 判断一个项目是否会成功、立法是否通过
通用 Web 补全上述遗漏的博客、新闻、文档 基础事实、官方资料

其中 Polymarket 是最大的亮点。 大部分聚合工具不会把预测市场数据拉进来,但 Polymarket 的赔率变化往往是市场情绪的领先指标。比如你想了解“苹果是否会发布折叠屏”,去 Polymarket 看“Yes”合约的价格走势,比看十篇分析文章更能感知真实预期。

关键技巧:写一个能跨平台聚合的 Prompt

虽然项目本身是以代码实现(Python + LLM 调用),但核心逻辑其实是一个极好的 Prompt 模板。你完全可以把它用在 ChatGPT、Claude、OpenAI Playground 里,手动模拟类似的效果。

下面是我从项目思路里提炼出来的模板:

text
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
你需要成为一个跨平台信息聚合器。你的任务是对以下主题,在过去30天内,从指定平台搜索并综合观点。

主题:{主题}
时间范围:最近30天(从今天往前推)

请依次搜索以下平台,并为每个平台列出3-5个有代表性的结果(标题+来源链接+一句话摘要):
1. Reddit(搜索相关子版块热帖)
2. X/Twitter(搜索相关话题和热门推文)
3. YouTube(搜索相关视频,优先高播放量)
4. Hacker News(搜索相关帖子及评论)
5. Polymarket(搜索相关预测市场合约,如有)
6. 通用Web(补充新闻、博客、文档)

最后,请基于以上信息,输出一份综述,包含:
- 总体热度:该主题在30天内是否有上升/下降趋势
- 主要观点:各方对主题的主流看法(附引用来源)
- 争议点:存在哪些分歧、哪方更可信?
- 预测信号:Polymarket上是否有相关合约,赔率反映了什么预期
- 个人建议:基于以上信息,你给读者的行动建议

注意:所有信息必须有明确来源,不要编造。如果某平台无结果,注明“未找到相关内容”。

差 Prompt vs 好 Prompt 对比

差 Prompt(直接问)

text
1
“最近30天关于AI Agent有什么热门讨论?”

输出通常是一段泛泛的概括:“AI Agent 最近很火,很多人在讨论 AutoGPT,LangChain 也有相关工具……” 没有来源,没有平台区分,也不告诉你争议是什么。

好 Prompt(用上面模板)

text
1
(复制上面的模板,填入主题“AI Agent 开源框架对比”)

输出你会得到:

  • Reddit: r/MachineLearning 热帖“LangGraph vs CrewAI 性能对比” 链接
  • X: @karpathy 推文讨论 Agent 框架选择 链接
  • YouTube: 视频“AutoGPT vs BabyAGI 实战” 52万播放 链接
  • HN: “Why I stopped using LangChain” 评论区 链接
  • Polymarket: 一个合约“Will CrewAI surpass LangChain by 2025?” 当前赔率65% 链接
  • 综述:框架选择存在明显两极,LangGraph 适合复杂流动,CrewAI 简单易用但扩展性存疑;预测市场押注CrewAI增长更快……

区别很明显:后者能直接拿来用,帮你省掉2小时搜集时间。

原理:为什么这样写有效

这个 Prompt 成功的背后是 分治+验证 的思维:

  1. 指定数据源:AI 不再天马行空,而是基于你划定的平台搜索(如果 AI 能联网,否则需要借助工具)。每个平台的文化不同,分开列出能避免混为一谈。
  2. 要求结构化输出:先列结果,再写综述。这让 AI 的推理过程更透明,你也能检查每个来源是否合理。
  3. 加入预测市场:Polymarket 是一个独特的“另类数据”来源,它给综述增加了前瞻性。AI 不会主动想到用这个,但你写进模板,它就会去检索。
  4. 强制引用:必须附链接,减少幻觉。如果 AI 找不到真实结果,它会输出“未找到”,而不是胡编。

变体和扩展用法

变体1:只做国内市场

可以把平台换成:知乎、微博、B站、微信公众平台、雪球。时间窗口可以改成“最近7天”。

text
1 2 3 4
主题:{主题}
时间:最近7天
平台:知乎(相关问题)、微博(热搜词)、B站(热门视频)、微信公众号(文章)
输出格式:每个平台Top3结果+综合洞察

变体2:关注预测类话题

去掉 Reddit 和 YouTube,保留 Polymarket、X 和 Web,专注于“市场预期”。适合分析:某公司股价可能走势、政策是否落地、产品是否会发布。

text
1 2 3
主题:美国大选对科技公司的影响
平台:Polymarket(相关合约)、X(政治话题)、Web(民调和新闻)
输出:赔率变化、主要争议点、关键人物的表态

变体3:技术追踪专用

如果你只关心 GitHub 动向,可以把数据源换成:GitHub Trending、Hacker News、Reddit r/programming、X(技术大V)。时间窗口设为“最近24小时”。

text
1 2 3
主题:最新开源 AI 工具
平台:GitHub Trending(新星项目)、HN(新工具讨论)、Reddit r/MachineLearning(热门帖子)
输出:项目名称、Star数、主要特色、社区评价

Prompt template for cross-platform information aggregation with structured output

自己搭一个类似的 Agent

如果你懂一点 Python,可以用 LangChain 或 CrewAI 快速复现。核心代码逻辑:

  1. 定义每个平台的搜索函数(使用官方API或爬虫)。对于 Reddit,用 praw;X 用 tweepy;YouTube 用 google-api-python-client;HN 用 algolia 公开 API;Polymarket 可以用它的子图查询;Web 用 serpapiduckduckgo_search
  2. 将这些函数注册为 LLM 的 Tool,或者让 Agent 按顺序调用。
  3. 最后将抓取结果放入 summary prompt(上面那个模板)让 LLM 输出。

一个简化版的伪代码:

python
1 2 3 4 5 6 7 8 9 10 11 12 13 14
from langchain.agents import Tool, create_openai_functions_agent
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(model="gpt-4")

# 定义搜索工具
tools = [
    Tool(name="Reddit Search", func=search_reddit, description="搜索Reddit最近30天帖子"),
    Tool(name="X Search", func=search_twitter, description="搜索X最近30天推文"),
    # ... 其他
]

agent = create_openai_functions_agent(llm, tools, prompt=agent_prompt)
# agent_prompt 需要包含最后的综述指令

注意:如果不使用 Agent 框架,也可以手动写一个顺序调用:先依次调用各搜索函数并收集结果,然后一次性把结果塞进 summary prompt 让 LLM 输出。后者更简单且成本可控。

实际使用的注意事项

  • API 费用:每个平台几乎都有 rate limit,Reddit 和 X 的免费额度很有限。如果高频使用,建议结合缓存或用付费 API Key。
  • Polymarket 数据可靠性:预测市场虽然有趣,但流动性差的合约赔率容易被大户操纵。参考时注意成交量(Volume)指标。
  • 信息过载:如果主题太宽泛(比如“AI”),每个平台会返回上百条结果,LLM 的生成质量会下降。建议主题越具体越好,比如“OpenAI 的 GPT-5 发布时间预测”。
  • 时间窗口的精确性:30 天是个不错平衡点。如果你想跟踪周趋势,改成 7 天;如果想做长期研究,90 天也行,但注意结果数量会指数级增长。

我的个人看法

这个项目“技术”本身并不复杂,但它的数据源选择非常聪明。把 Polymarket 和其他社区结合,等于把“未来预期”和“当前讨论”放在一起对照,这对产品决策或投资参考很有价值。GitHub 一天 37k Stars 也印证了开发者对这类“快速感知”工具的真实需求。

但我认为,它最大的价值不是开箱即用,而是 给出了一种思路:你可以根据自己的场景定制数据源和 Prompt,构建专属的“信号雷达”。比如你关注开源项目,就盯 GitHub + HN + Reddit;你关注金融,就加 Polymarket + X + 财经新闻。

与其等别人更新 Skill,不如自己动手改改模板。上面那个 Prompt 模板直接复制到 ChatGPT(记得 enable web search)就能跑。如果你想跑得更溜,花一下午写个 Python 脚本挂起来。

试试看,你会发现自己对行业动态的感知快了一个量级。