随便翻了一下有明文规定禁止爬虫程序的:
https://o3o.ca/about
https://m.cmx.im/terms
@zshowing 我理解的获取数据,应该也包括了对条目信息的统计,比如谁转发了什么、累计转发多少条、如何排序,这些是要拉取到本地再进行处理的吗?如果是的话那我觉得还是获取数据,不是说只有像殆知阁一样把数据拿走复制到别站才算吧,那是极端情况。当然这个你也可以跟别的站长和用户讨论一下,看看其他人怎么判断,我讲了不算
@zshowing @admin 你好,我是一个mastodon站点的站长,我也觉得这个行为有不妥之处,“用API爬取数据再进行转嘟”和“真人用户在时间线上看到嘟文进行转嘟”之间有所不同,后者是普通用户的正常行为,而前者,在现在的网络环境,考虑到热门嘟文大部分具有的键政性质,无差别地爬取嘟文无疑会影响到社群安全感,让这些朋友产生被观看和被监控的恐慌情绪,甚至采取更趋于封闭的社交策略(比如限制嘟文阅读范围),这对社群是相当不利的,也直接影响大家冲浪的自由体验。
我在Timeline上也看到一些朋友各自发表了对这个bot的不满,以及不希望被爬取采集(而不是通过nobot标签防止被收录)的态度,希望您能再次斟酌是否继续这一行为,非常感谢。
@Hydrangea @admin 好的收到!我马上停止掉它
@admin 我看到里面写的爬虫是「获取数据」,可是这个bot只是在本站里面把转发数+1啊!没有把数据获取到外站啊