我的Galgame资源发布站 - 忧郁的弟弟 是由忧郁的弟弟提供的汉化Galgame下载站点,关于该站点介绍请访问:关于若干注意事项(新人必读) | 我的Galgame资源发布站
资源备份档分享请见:Mygalgame全站资源备份
他人抓取项目请见: Mygalgame backup
弟弟站点html结构十分规范,而且爬取特别容易。问题在于该站的资源都是用百度云进行存储,而百度云的转存与下载较为麻烦。这里我们采取抓取和转存分别进行的方法,构造备份站点。步骤如下:
- 对弟弟站所有页面进行抓取下载并存储。
- 进行百度云批量转存,使用BaiduPCS-GO进行下载操作。
- 使用rclone转存到GDrive以及OneDrive。
- 使用OneIndex进行展示~
关于“忧郁的弟弟”站点备份,Github已有类似项目,具体可参见:Beats0/www.mygalgame.com
站点爬取
目前弟弟站的百度云链接需要使用post的方式二次获取,故在获取到文章链接后,构造post表单进行获取。方法如下:
1 | import re |
经过上述爬取,仍发现几项缺失,具体列在下表:
| 缺失项 | 可能的名称 | 备注 |
|---|---|---|
| A345 | ***资源吃饭 | 没找到~ |
| A457 | 下级生2 | 与下级生1(A456)同一页面 |
| A458 | 恋×シンアイ彼女 体験版 | 正式版见A584 |
| A516 | オトメ*ドメイン 体験版 | 参见他人备份补齐 |
| A574 | 千恋*万花 | 手动补齐 |
百度云转存下载
使用Selenium半自动登陆并转存。代码如下,前半部分登陆手动完成,后面分享转存交由程序进行。
1 | from selenium import webdriver |

注意:
- 估算每个Gal的体积为2G,故1T百度云盘约能转存500左右游戏。
- 请使用开发者工具block掉一些请求,以防止页面长时间等待加快速度。例如:

而下载使用 BaiduPCS-GO。使用前面获取的BUDSS进行登陆,并使用screen挂在后台进行下载即可。(然而使用国外服务器下载还是很慢23333)
简介清洗
因为OneIndex能展示READMD.md,所以将原有html格式简介清洗为markdown格式的文件,示例格式如下:
1 | import subprocess |
OneIndex建站
随意找一个微软5T的盘,绑定OneIndex进行展示,使用rclone将Google Drive上面的文件夹完全转发。
