codex/find-how-to-browse-webpage-0n2n2o xinxishouji|合规数据采集工作台 xinxishouji|多平台资讯自动化收集蓝图 codex/find-how-to-browse-webpage-0n2n2o
合规优先 · 自动化采集工作台原型

不是报告页:这是可点击的多平台信息搜集工作台。

你可以从“开始搜集信息”入口一键体验,也可以先配置平台、关键词、频率、合规状态和通知方式,再生成交给后端 Connector 执行的任务配置。GitHub Pages 只能运行前端页面,真实采集需要后端服务与官方 API / 授权数据源配合。

手动新建采集规则 查看方案文档

多平台资讯 / 线索自动化收集蓝图

把分散在多个平台的公开信号,整理成可行动的线索。

xinxishouji 面向闲鱼、小红书、X(Twitter)和 Reddit 等来源,规划从采集、清洗、去重、分析到通知的完整工作流,帮助团队合规地发现商机、趋势和内容选题。

codex/find-how-to-browse-webpage-0n2n2o
明显入口

开始搜集信息

点击右侧按钮会自动载入一组示例规则,并模拟生成采集任务、运行日志和结果预览。配置自己的关键词后,按钮会按你的规则重新生成任务配置。

采集面板

当前页面会把规则保存在浏览器本地,用来验证采集方案和生成后端任务配置。

已配置规则0
启用平台0
合规通过0
模拟线索0

搜集结果预览

还没有运行采集任务。点击“开始搜集信息”体验入口。

新建采集规则
重要边界本页面不会绕过登录、验证码、风控、隐私设置或付费墙;小红书和闲鱼默认建议采用授权导入、人工上传或平台允许的公开分享链接。

已保存规则

规则会保存在当前浏览器本地,可导出 JSON 交给后端服务执行。

后端运行流程建议

1
调度器读取规则

按频率、优先级和 API 预算生成任务,并记录任务状态。

2
平台 Connector 采集

优先走官方 API、授权导出、RSS、合作数据源或人工上传,不实现绕过平台保护的逻辑。

3
清洗、去重与评分

统一数据模型,保留必要字段,对重复内容、广告和无关结果做过滤。

4
通知与审计

生成日报、告警或 Webhook,同时记录来源、授权、删除和导出操作。

任务配置 JSON

这里生成的是前端配置,不会直接采集数据。接入后端后,可作为调度器和 Connector 的输入。

[]

核心能力

先建立稳定、可审计的数据闭环,再逐步扩展到更多平台和更高阶分析能力。

多平台采集

支持按关键词、话题、作者、社区、商品类目和价格区间等规则进行监控,并预留更多平台接入能力。

统一数据模型

把帖子、商品、评论、作者和互动数据整理成统一结构,便于搜索、筛选、评分和后续分析。

分析与通知

围绕趋势、情绪、意图和机会评分生成日报、周报或即时告警,减少人工筛选成本。

建议架构流程

项目推荐采用“配置中心 → 调度队列 → 平台 Connector → 数据处理 → 分析通知”的解耦架构。

项目文档

如果你想继续开发,可以先按下面顺序阅读文档。

项目设计方案

了解项目定位、典型场景、模块划分、数据模型和技术选型建议。

迭代路线图

从 MVP 到运营工作台,逐步规划采集、搜索、通知、分析和稳定性建设。

合规与风险清单

明确平台接入、数据最小化、删除更新、权限控制和上线前检查事项。

合规优先 项目只应采集你有权访问、平台规则允许、且符合当地法律法规的数据;优先使用官方 API、开放数据源或授权能力,不绕过登录、验证码、风控、隐私设置或付费墙。
main