Follow

随便翻了一下有明文规定禁止爬虫程序的:
o3o.ca/about
m.cmx.im/terms

@admin 我看到里面写的爬虫是「获取数据」,可是这个bot只是在本站里面把转发数+1啊!没有把数据获取到外站啊 :0520:

@zshowing 我理解的获取数据,应该也包括了对条目信息的统计,比如谁转发了什么、累计转发多少条、如何排序,这些是要拉取到本地再进行处理的吗?如果是的话那我觉得还是获取数据,不是说只有像殆知阁一样把数据拿走复制到别站才算吧,那是极端情况。当然这个你也可以跟别的站长和用户讨论一下,看看其他人怎么判断,我讲了不算

@zshowing @admin 你好,我是一个mastodon站点的站长,我也觉得这个行为有不妥之处,“用API爬取数据再进行转嘟”和“真人用户在时间线上看到嘟文进行转嘟”之间有所不同,后者是普通用户的正常行为,而前者,在现在的网络环境,考虑到热门嘟文大部分具有的键政性质,无差别地爬取嘟文无疑会影响到社群安全感,让这些朋友产生被观看和被监控的恐慌情绪,甚至采取更趋于封闭的社交策略(比如限制嘟文阅读范围),这对社群是相当不利的,也直接影响大家冲浪的自由体验。

我在Timeline上也看到一些朋友各自发表了对这个bot的不满,以及不希望被爬取采集(而不是通过nobot标签防止被收录)的态度,希望您能再次斟酌是否继续这一行为,非常感谢。

@zshowing @admin 谢谢您!!感觉在Fedi这边还是尽量减少这种类似拉清单的行为,挺多人喜欢这里就是因为弱搜索,话讲过即抛,沉在时间线里挖不出来的设置,因为有安全感。

再次感谢!

Sign in to participate in the conversation
创新比格云计算 Beagle Cloud™

站民的主要成分:比格犬、社交功能损坏患者、性少数、避世者。站长独裁,规则里没写具体的都是站长和管理员的自由裁量空间,谢谢大家拥护!邀请大家公投的时候请积极参与,让我们一起来假装这是一个和谐开明的民主实例!