要不要删除重复的题目?

2014年11月16日 20:44来自:后知后觉

因为是由网友自发上传题目,所以重复在所难免。做多了,也就会遇上。用网站自带的棋形题目搜索,也能搜到很多。到底要不要删除重复的题目呢?


roboter 写于 2014-11-16 13:151楼 
上传的时候,101系统会检查是否有重复的题目,会挡住大部分重复题目,但是在多一子,少一子的情况下系统无能为力。
同时旧的检测系统存在一些缺陷,不能检测黑白互换,对角线对称的题目。
新的检测系统已经解决掉这个问题,新系统检测后,发现大约有2000道题目是重复的。当时就想合并,但是调整的话,牵涉面较多,涉及到棋书,作业等等,很多题目不好合并,所以一直没有动手调整。
等时间充裕一点,再进行合并工作。

已经删除,撤销 | 关闭
后知后觉 写于 2014-11-16 13:262楼 
你说的多一子少一子是问题,估计系统永远无法解决了,可以考虑发动群众手工判定。我愿意帮忙。
已经删除,撤销 | 关闭
胡世奇23 写于 2014-11-17 3:303楼 
我也愿意
已经删除,撤销 | 关闭
roboter 写于 2014-11-17 11:454楼 
谢谢两位,现在发现的话,发个帖子出来吧,后面统一进行合并
已经删除,撤销 | 关闭
后知后觉 写于 2014-11-18 14:395楼 
以后发现了重复题目我会在这里发出来。但我希望版主先通过程序算法剔除完全重复的,然后我们再查找漏网的,不然机器能干而且干得比人好的活我们抢着去做就事倍功半了。
已经删除,撤销 | 关闭
roboter 写于 2014-11-19 13:176楼 
好的,本周内统一整理一下
已经删除,撤销 | 关闭
张耀文 写于 2014-11-20 12:07楼 
我也愿意
已经删除,撤销 | 关闭
roboter 写于 2014-11-20 15:08楼 
今天全部重新整理了一下,共有2358对题目相同,淘汰掉不常用的题目。
这些题目的做题数据不好转移出来,比较可惜,整个101的做题数量减少二三十万,各位棋友的有效做题数量也会相应减少。

以后棋友发现有相同的题目,发个帖子出来,我们一个个消灭掉。
已经删除,撤销 | 关闭
后知后觉 写于 2014-11-20 15:239楼 
涨棋才是硬道理,其他东西都是浮云哉。
已经删除,撤销 | 关闭
银冈棋院 写于 2014-11-21 1:210楼 
我认为重复并没什么问题,重要的是控制好重复的比例不要太高就成了!摆定式还要四角双色,死活四角又有什么不妥?关键是质量高的题越多越好,适度淘汰部分不好的题目才是正道!
已经删除,撤销 | 关闭
后知后觉 写于 2014-11-21 9:4211楼 
Q-28137Q-1397
Q-19191和Q-25847Q-25905
Q-14322Q-2293(建议删除后者)
Q-940Q-1919
已经删除,撤销 | 关闭
roboter 写于 2014-11-21 12:1112楼 
好的,记下了,准备合并一下。
已经删除,撤销 | 关闭
后知后觉 写于 2014-11-29 13:2713楼 
Q-23Q-22633本质相同。
已经删除,撤销 | 关闭
后知后觉 写于 2014-11-29 13:2814楼 
淘汰后的题目棋友还看得到吗?
已经删除,撤销 | 关闭
roboter 写于 2014-11-29 13:4115楼 
还能看见的,但是不会进入作业系统,也不会进入棋形搜索集合中。
已经删除,撤销 | 关闭
真的2了 写于 2014-12-2 13:5816楼 
Q-31373Q-16798是一样的题目吧?
已经删除,撤销 | 关闭
roboter 写于 2014-12-2 14:517楼 
是的,就差一个子
已经删除,撤销 | 关闭
爱乐奕 写于 2014-12-3 4:3318楼 
各类著作的重复题不主张删除,列出来更能让人看出来谁引用谁的著作,比如天龙图里大量的日本大家的作品。
题目上面显示的出处是我很喜欢的关注点
已经删除,撤销 | 关闭
爱乐奕 写于 2014-12-3 4:3319楼 
已经删除,撤销 | 关闭
roboter 写于 2014-12-3 12:5420楼 
@爱乐奕 ,题目都不会删除的,如果两本书中有两题是重复的,会淘汰掉其中一题,淘汰的题目也会从棋书中删除,但是同时也把保留的题目按照顺序放入到那本棋书中,这样题目在棋书中的引用是不会丢的。
已经删除,撤销 | 关闭
pokeii 写于 2014-12-5 5:1321楼 
计算资源够的话多一子少一子总能解决吧,想法把题定义个距离就行了,比如每个点不同算距离1,取旋转、翻转变换之后最小值。然后可以把距离为1、2的人工看看
已经删除,撤销 | 关闭
pokeii 写于 2014-12-5 5:1422楼 
我觉得这样最多应该也就耗以前几倍的时间。因为发现距离>2就可以不再计算。
已经删除,撤销 | 关闭
pokeii 写于 2014-12-5 5:1623楼 
这样以后每道题还能自动给出类似的题......
已经删除,撤销 | 关闭
roboter 写于 2014-12-5 11:624楼 
嗯,现在已经上线相似题统计功能,可以解决多一子少一子的问题了
已经删除,撤销 | 关闭
w_34202591194616 写于 2019-10-13 10:2325楼 
OK
已经删除,撤销 | 关闭
username 写于 2019-10-13 13:2126楼 
考古……

能不能比如说对死活题检测一个外边界,然后外边界外的子忽略?就是tsumego.js那种(GitHub上有,不过我没用过)?
已经删除,撤销 | 关闭
爱乐奕 写于 2019-10-13 14:4027楼 
性质完全一样的相似题能够在棋书中置换就好了,不然在好好一本书里面放道淘汰题大大不妥,现在的置换方法找题目在棋书的位置太麻烦了
已经删除,撤销 | 关闭
username 写于 2019-10-14 4:5628楼 
给棋书设置一个“回收站”功能……回收站里都是淘汰的题目,要点进一个专门的章节?
已经删除,撤销 | 关闭
gaoruihua 写于 2020-3-9 2:4229楼 
已经删除,撤销 | 关闭