42 lines
1.6 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# NewsMinimalist RSS
从 [newsminimalist.com](https://www.newsminimalist.com) 抓取 Gemini AI 评分的新闻,生成 RSS Feed + HTML 页面,含 Google 中文翻译。
## 定时同步(每隔 6 小时)
| UTC | 沙特 (UTC+3) | 北京 (UTC+8) | 动作 |
|:----|:------------|:------------|:-----|
| 02:50 | **05:50** | 10:50 | scraper 抓取 + 翻译 → JSON 缓存 |
| 05:55 | **05:55** | 10:55 | Hermes 简报(读 RSS → 推微信) |
| 08:50 | **11:50** | 16:50 | scraper 抓取 + 翻译 → JSON 缓存 |
| 14:50 | **17:50** | 22:50 | scraper 抓取 + 翻译 → JSON 缓存 |
| 17:55 | **17:55** | 22:55 | Hermes 简报(读 RSS → 推微信) |
| 20:50 | **23:50** | 04:50 | scraper 抓取 + 翻译 → JSON 缓存 |
> 4 次 scraper 运行(偶数时区可覆盖),其中 05:50 / 17:50 对齐 Hermes 简报5 分钟后消费)。
## 架构
```
browserless (Chrome headless)
↓ /content API
scraper.py → 解析 <details> → 提取 [score] title (source) link
↓ JSON 缓存
server.py → RSS 2.0 + Atom + HTML中文优先
↓ NPM location 反代
https://rsshub.arabiancloud.online/newsminimalist
```
## 文件
| 文件 | 说明 |
|:-----|:-----|
| `scraper.py` | 爬虫browserless 渲染 → BeautifulSoup 解析 → Google Translate 中文 → JSON 缓存 |
| `server.py` | 服务:读 JSON 缓存 → 输出 RSS 2.0 + Atom + HTML中文标题优先英文副标题 |
## 关键依赖
- `browserless/chrome` 容器RSSHub compose 自带)
- newsminimalist-rss 容器需连接 `rsshub_default` 网络(访问 `browserless:3000`
- Google Translate 免费接口(无 API key