2021年6月29日星期二

双拼输入法问题中的幸存者偏差现象

为了便于表述,我简单的把拼音输入法中的双拼方案简称为“双拼输入法”。

一次机缘巧合,我接触到了双拼输入法。后来在网上查找双拼输入法的资料的时候,关于“双拼和全拼哪个好用”、“双拼有没有必要学”、“双拼输入法有哪些缺点”等问题,发现下面的回答有一个现象:作答者都是支持双拼输入法的,几乎找不到反对的。

难道真的如那些问题的作答者说的那样,双拼输入法非常好用,因为宣传不够导致使用人太少了吗?双拼输入法用的很少,大可从身边的人调查便知,几乎是不用证明的题目。一个东西很好,使用的人却不多,这明显和常理不符。但是为什么会出现上面问答的情况呢?我觉得可能是幸存者偏差。遇到“双拼输入法”的问题,作答者一般都是使用双拼输入法的人,因为不知道或者不会使用双拼输入法的人看到这些题目不知道如何作答就直接跳过了。这样就使得“双拼输入法”下面的回答都是双拼输入法使用者的作答,因为“双拼输入法”和“全拼输入法”的互斥性,双拼输入法使用者都在使用“双拼”不使用“全拼”,无疑是“双拼”的支持者,所以遇到“双拼输入法”的问题我们会看到挺的多踩的少了。

双拼输入法诚然有很多优点,把韵母映射到键盘从而减少击键次数,提高输入效率。但是它也有一些缺点:比如双拼的方案众多没有统一,阻碍了双拼的发展;双拼有一定的学习门槛,如果要熟练掌握需要花费不少的时间;双拼因为输入的冗余信息过少,对汉语拼音的准确度要求更高等。

博客的流量用完的解决过程

我的博客用的是廉价的虚拟主机空间,只有500MB的磁盘空间,每个月15G的带宽流量,正常价每年四十几块钱,赶上活动的话几乎半价就可以购买了。所以我一下买了五六年的了。

这些年这款虚拟主机空间用起来很不错,速度可以接受,几乎没有宕机过,每个月15G的流量也从来没有用完过。但是没想到5月31日博客无法访问了,页面提示如下信息:

Bandwidth Limit Exceeded
The server is temporarily unable to service your request due to the site owner reaching his/her bandwidth limit. Please try again later.

我登录主机商提供的cPanel面板看了下,流量从3月开始明显增加的。但是为什么会增加就不得而知了,博客早就没有使用谷歌统计和百度统计。我仔细回想下3月份做了什么操作,想来想去发现了3月开始启用了WP Super Cache 插件。我觉得可能是这个原因,于是尝试着停掉WP Super Cache 插件,观察了几天看看,发现流量确实下降了不少。

后来登录cPanel面板发现有个Awstats的统计功能,可以统计网站的访问信息。看了下每个月统计报表发现网站的流量分为浏览器用户流量和非浏览器用户流量,其中大部分是非浏览器流量。非浏览器流量包括搜索引擎机器人,蠕虫病毒产生的流量和非正常的HTTP相应。下面是3月-5月的流量详情:

3月浏览器流量3.28 GB,非浏览器流量5.05 GB
4月浏览器流量2.37 GB,非浏览器流量5.31 GB
5月浏览器流量3.94 GB,非浏览器流量8.31 GB

这个时候我才知道网站的流量不仅仅是真正的用户浏览消耗,还有搜索引擎的机器人消耗,而且我的网站大部分的流量反而是机器人消耗的。看了下统计报表发现机器人爬虫中有个叫DotBot是最坏的,它消耗的流量最多,这时我才明白爬虫有好的爬虫也有坏的爬虫。我才想起来robots文件可以限制机器人爬虫的访问,一直以来都是留空的没有配置。上网搜索了下robots.txt怎么配置,摸索了一下,我的配置信息如下:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /trackback/
Disallow: /comments/
Disallow: /attachment/
Disallow: /comments/feed
Disallow: /feed
Disallow: /link
Disallow: /*/feed
Disallow: /*/comment-page-*
Disallow: /*?replytocom=*
Disallow: /*/trackback
Disallow: /?s=*
Disallow: /*/?s=*\
Disallow: /wp-*.php
User-agent: MJ12bot
Disallow: /
User-agent: YisouSpider
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: SemrushBot-SA
Disallow: /
User-agent: SemrushBot-BA
Disallow: /
User-agent: SemrushBot-SI
Disallow: /
User-agent: SemrushBot-SWA
Disallow: /
User-agent: SemrushBot-CT
Disallow: /
User-agent: SemrushBot-BM
Disallow: /
User-agent: SemrushBot-SEOAB
Disallow: /
user-agent: AhrefsBot
Disallow: /
User-agent: DotBot
Disallow: /
User-agent: Uptimebot
Disallow: /
User-agent: MegaIndex.ru
Disallow: /
User-agent: ZoominfoBot
Disallow: /
User-agent: Mail.Ru
Disallow: /
User-agent: BLEXBot
Disallow: /
User-agent: ExtLinksBot
Disallow: /
User-agent: aiHitBot
Disallow: /
User-agent: Researchscan
Disallow: /
User-agent: DnyzBot
Disallow: /
User-agent: spbot
Disallow: /
User-agent: YandexBot
Disallow: /
User-agent: link
Disallow: /
Sitemap: https://www.jingfengshuo.com/wp-sitemap.xml
Sitemap: https://www.jingfengshuo.com/sitemap.xml

统计报表中有个奇怪的UA名称一个是link一个是feed,我看了网站日志,也没找到名字叫link和feed的。不得而知后问了主机空间的服务商,他说robots.txt只是针对遵守规矩的好蜘蛛,对坏蜘蛛可能没有效果,最好在.htaccess中限制UA的活动,在他的指导下,在.htaccess中添加了如下代码:

rewriteengine on
RewriteCond %{HTTP_USER_AGENT} ^.*link.* [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^.*feed.* [NC]
RewriteRule .* – [F,L]

又看到cPanel面板有个Webalizer分析工具,它统计出了IP访问网页的数量,我在日志中找到这些IP,看他们到底访问什么内容,发现可疑的就禁止了这些IP访问网站。

这几天一直在观察网站的访问情况,发现流量总算降了下来。看来用robots.txt和.htaccess限制蜘蛛的访问还是很有用的。

2021年6月28日星期一

第三次入坑学习双拼的过程

距上次入坑有了一段时间了,又想起来双拼输入法,反正闲着也是闲着,学习一种技能总不是什么坏事。

0、选择双拼方案

这次选择了知乎上推荐比较多的小鹤双拼方案,用的人多到时候有问题也好解决。

1、看键盘

找出小鹤双拼官网的键位表,一个按键一个按键的记对应什么韵母,声母只需记zh、ch、sh这三个,先把简单的解决了。

然后看韵母,看键盘韵母都在什么位置,这时候助记歌很有用。这里我走了些弯路,之前什么都不背,把输入法调到双拼就开始输入了,想偷懒,通过长时间的练习来记住韵母的位置。这种方法有个问题,每次输入韵母都要去找好久,非常打击自信心。通过助记歌稍微记下韵母的位置,找的时候就没有那么辛苦了。这里我建议花上一个小时的时间去记忆韵母键盘的位置。

最后找张白纸,默写每个键位的韵母。基本上记住了,达到指出一个字母可以说出它的韵母了。

3、练习练习再练习

记下了韵母的键盘位置接下来就是不停地练习,把手机和电脑输入法切换成双拼的模式,开始艰难地练习之旅。

4、双拼从练习到放弃

6月23日,今天开始学习,大概花了半个小时记键位,然后在纸上写下26个字母,让自己写出每个字母对应的双拼韵母,试了几次几乎记住了韵母的键位了。接下来开始练习。

一天用双拼估计打了几百个字吧,能打出来就是很慢,打的时候老去花时间去找韵母,用打字软件测了下速度,大概每分钟二三十个字。

6月24日,继续练习,觉得没什么长进,手总是不自觉的按到全拼那里。

6月25日,打字仍然很慢,打熟的几个字不用想,大部分的几个字还是会想很久,虽然都能想出来对应的韵母,还是很慢。

6月26日,本来我要坚持一周看下自己的学习效果的,现在想放弃了。打字太费脑子了,最主要的是我并不需要那么高的打字速度。

6月27日,这几天在不停的看双拼的相关学习资料,最终决定彻底放弃双拼了,最主要的原因是双拼方案众多,没有统一的方案,各自为政。大家选择小鹤双拼的原因是小鹤双拼开发者还在维护,问题能很快得到解答,社区还在。自然码双拼就是因为开发者不管了,社区没落了。这就是双拼最大的问题,当开发者不维护了,社区不存在了,这种双拼方案使用的就会少了,流行的输入法支持的也就少了。

据有经验的人说,从全拼转双拼比双拼方案转换容易的多,也就是一旦记住了一种双拼方案再转换的话会非常困难。

后来竟然发现了国标双拼方案,和小鹤双拼的键位差别很大。我害怕出现如下场景:双拼方案没统一,我记住了一种双拼方案并熟练掌握的话,如果这种双拼方案没落了,我不得不切换另一种方案,还不如现在保持全拼输入,等时机成熟了再转也来得及。

下面这两段话本来是学习双拼成功后的感言,现在看来有点可笑。本想删除的,留下来看看也好。

我从6月23日开始双拼输入,坚持不切换回全拼,到X日双拼的输入速度已经达到了全拼了,X日双拼已经超过全拼了。

从接触双拼到完全熟练使用双拼,我尝试了3次,前两次都失败了,坚持了几天就放弃了。后来总是会想起来,总是想再试一试,到第三次终于坚持了下来。

2021年6月1日星期二

续草稿202105

爱丽丝奶奶手腕受伤

4月14日周五,爱丽丝奶奶坐在地上的爬爬垫上,起身的时候右手支撑着地,站起来后右手手腕有点疼。爱丽丝爷爷说多运动甩甩手就好了,让她晚上跳舞的时候使劲甩手。

4月15日周六,没觉得有什么问题,继续用右手炒菜做饭。

4月16日周日,手腕越来越疼了,开始去药店买风湿贴贴上。

4月17日周一,我下班回去才知道她的手腕受伤了,这时已经肿了很大,用一根黑布条绑着挂在脖子上,晚上也没怎么吃饭。这时想起来Jasmine去年去云南扭伤脚吃的药效果很好,于是把要拿过来给她吃。吃的药是:龙神元胡止痛滴丸、金品痛舒胶囊。

4月18日周二,据说手疼的一夜没睡着,中午艾莎放学的时候看到奶奶疼得直哭。

下午我带她去医院。

医生问了情况,在病历本上写着“排除骨折”,但是还是让去拍了X光片。

结果出来了,医生说月骨处有一块骨头错位了,其他地方的骨头跑到这里来了。医生用力按了按错位的地方,但是又不疼,他一时说不上来到底什么原因。

他问,是不是以前骨折过。

爱丽丝奶奶说,没有。

他说,这个需要会诊确认,然后转身向我说到楼下等X光片。

我在楼下等了20多分钟,X光片洗出来了。到楼上还没递到医生手里,他抢先说,已经看过了。

我问他是什么原因。

他说,月骨那里先不用管它,看起来不是新伤,先按筋膜炎来治疗。

然后开了一堆的药,让我去缴费。

等我缴费回来,我看爱丽丝奶奶手臂上已经帮了绷带。

医生说,吃了药应该就会好的,月骨错位的问题自己记得就行了,下次再次遇到要和医生说清楚。

总结:

拍X光片:月骨骨头错位。诊断:骨头应该是老伤,筋膜炎

仙河 跌打生骨胶囊,每天两次,每次三片。

天施康 血康胶囊,每次两粒,每日三次。

双氯芬酸钠缓释片 扶他林,每天一次,每次一片。

5月19日一天,爱丽丝奶奶都说疼痛减轻了好多。以为慢慢会好的。

5月20日周三一早,爱丽丝奶奶打电话说,从昨天夜里一点到早晨起来手疼的厉害,几乎一夜没有睡着,我又带了他去医院。

先去的是上一次看的那个小医院,那个医生说定期来换药就行,换三次。

我们问医生换药可以好吗?医生说肯定可以好,药要吃十天才行。

我们觉得这个医生不靠谱,准备去换一家大点的医院。我骑车带着爱丽丝的奶奶去了附二医院。这个医院的医生是一个老头,看了X光片以后,一边叹气一边说:这个很难搞,这个很难弄,先去拍一个CT再说。

我给Jasmine打电话。她说既然要看就要相信他,不然的话还不如去最好的医院,不然的话到最后还是要换医院更麻烦。于是我骑着电动车,带着爱丽丝的奶奶去了中心医院。

挂的是中医骨伤科。医生听了我们的描述,看了他奶奶的手,然后左右看了看,就让去抽血。我纳闷为什么手臂疼要抽血呢,于是把X光片拿出来给他看。

他有点不耐烦,眼睛瞟了瞟说,这个看不清楚,要拍CT。于是给我开了抽血和CT的检查。

我说直接拍ct行不行?他说这个还是要抽血。看来他ct是顺带做的。

他说,看起来骨头没有问题,可能是痛风或者风湿,所以抽血才能看得清楚。

我们到抽血的地方,然后爱丽丝的奶奶说早上吃饭了,今天又没办法抽,然后又排队去预约CT,预约到明天的下午四点半才能做。

5月21日,第二天早上我们有跑到了医院,很快就抽好血了。但是结果要等到11点半才能拿。我们想着反正闲着也是闲着,就在医院等结果,说不定可以提前出来。

没想到结果还是11点半才出来,还好这时医生还没有下班,我们直接找到了那个医生。他看了下抽血结果,说没有问题。他问CT呢,我们说还没做。他问我们该怎么办,是先吃点药还是等CT结果出来了再说。

爱丽丝奶奶说先吃药看看。于是医生给开了3种药:洛芬待因缓释片、甲钴胺片、新癀片。

拿过药爱丽丝奶奶说先吃药看看,把CT检查往后改改。我跑去检查室把CT的检查改成了下周一。

回到家吃了药,下午4点爱丽丝奶奶手臂肿得厉害,疼得眼泪就出来了。这时我也不知道怎么办,Jasmine建议去一开始的医院去敷药,敷药后疼痛可以减轻,先减轻疼痛再说。

跑去小医院,医生说,一般吃了3天的药会有缓解的,现在还是疼就不知道了。先去抽血,不行就要做CT了。爱丽丝奶奶没听,说先敷药再说,医生很无奈。

回到家我和Jasmine说了这个事情,Jasmine说他们单位有人认识检查室的人,可以把CT的结果提前点。晚上就把CT提前到明天中午了。

5月22日周六,爱丽丝爷爷带着奶奶去做了CT,结果要下周一才出来。

5月24日周一,下午三点半,CT结果出来了,我带着爱丽丝奶奶去了医院,医生看了看说骨头没什么事,钙化了。我们问怎么预防,医生什么都没说,直说不要提重物。开了2种药就回来了,第二种是治疗甘油三酯高的:痹祺胶囊、辛伐他汀片。

5月爱丽丝感冒、嗓子起泡(病毒疱疹性咽峡炎)

5月15日早上起来,爱丽丝流了鼻涕,咳嗽了几声。给她吃了肺力咳和开瑞坦,然后我们就去黄金海岸玩了一整天,一天也没听见她怎么咳嗽?晚上回来又继续给她吃的药。

5月16日一天没有出去,继续给爱丽丝吃药,咳嗽的明显少了很多。

5月17日,周一开始上学,就没有给爱丽丝吃药了,他也没怎么咳嗽了。

5月18、19日,爱丽丝有点流鼻涕,但是也几乎也没怎么咳嗽?就没没有管他。

5月20日放学,回到家发现她嗓子哑了,她说嗓子还有一点疼,我们看了一下,嗓子很红,而且起了两个水泡,这个症状和上个月很像,于是参照上个月的用药给他吃了药:四季抗病毒胶囊,每天3次,每次1粒;维生素B2,每天3次,每次1粒;复方维生素B12溶液(喷剂),每天3次,每次喷一下;双歧杆菌四联片,每天3次,每次一片。

5月21日,昨天夜里睡觉发现爱丽丝不老实,动来动去,总是说好热,量了体温有点发热。今天没有去上学,在家休息一天。

5月22日,今天嗓子不红了,泡破了,不疼了。嘴巴上面起了2个小泡,有点疼。夜里睡觉总是说肚子疼。

5月23日,今天嘴巴的泡几乎看不到了,也不红了,有点咳嗽。

这次爱丽丝的病毒疱疹性咽峡炎的症状很轻,应该是上次患病以后有了抗体的缘故。

买房记2

4月30日,之前看的三楼的房东时隔半个月打来了电话,说同意降价卖给我们了。我把消息告诉了Jasmine和小蜜瓜,她俩一个劲儿地抱怨这个房东耽误事,如果早点降价就买好了。

看得出来小蜜瓜想买套房子自己住,她觉得3楼不错,无赖房东油盐不进对价钱寸步不让,小蜜瓜生气不想买了,没想到那边5楼已经谈好了这个3楼房东又来妥协,但为时已晚,那边的5楼没办法退掉了。

5月3日,Jasmine和小蜜瓜去银行给5楼房东转账,银行说假期不能转,因为是跨行转账,需要经过中国人民银行,不能实时到账,卡在中间就麻烦了。

5月6日,小蜜瓜自己去银行转了帐。上午房东把房产证、土地使用证和身份证都给了我。

5月7日,Jasmine拿着原件去了中介,中介很快就跑出去办理出图手续了,中午原件送了回来,说3个工作日出图纸。

5月11日,中介去交易所出房屋评估价,5月14日评估价出来了。中介说小蜜瓜的户口本的婚姻状况栏是空的,要补上。Jasmine问了老家派出所和交易所,问的结果是补上户口本上的婚姻状况或者出具死亡证明,考虑之下还是把户口本寄回老家补打户口本。

5月17日,卖家去办理房改。户口本寄出去了。

5月20日,卖家的房改办好了,我们约了周六下午去办理过户手续。

5月22日,Jasmine带着小蜜瓜去房产交易中心办理了过户手续,现在手续很简单,很容易就办好了。

5月24日,通知缴税费,可以手机微信缴了,很方便。5月25日,卖家也在微信上缴了税费。

5月30日,卖家约我们去交房,我们去去看了看,给了我们房屋钥匙。其实也没什么看的,很快就回来了。

5月31日,交易中心通知去领房产证,领证费80元。