书迷楼

手机浏览器扫描二维码访问

第十八章 语义识别的难点(第3页)

“联网就联网吧,在程序里预留一些常用算法,断网勉强也能用。”

解决了第一个问题之后,罗辑又陷入了瓶颈。

他蓦然想起中文还有一点很蛋疼,那就是没有和英文一样可用于区分人名地名的大小写。

要是仅仅这样也就罢了,关键是有些人的名字起就是一个词语,如果分词程序有智能的话,它一定会把这些人拖出去砍死。

比如高峰、汪洋、罗辑……

“这……还是不要砍死了,半残就好。”

罗辑马上停止了抱怨了,再困难也要解决不是?

“到底要怎么做?”

罗辑觉得自己有些天真了,一开始以为有了科技树绝对可以快速的解决问题,可事实上并非如此。

之前做无线充电器时,都要用到机械方面的知识,而难度比无线充电更大的语义识别,其交叉的学科只会更多。

“语义识别要什么?电脑编程、统计分析、数据建模……还有语言学?”

罗辑看到科技树上显示的内容完全傻眼了,前面的只要的理科内容,不管多难他都不怕,可偏偏最后一项他却没有办法。

让罗辑去看文科知识,那比杀了他还难受。

可不学语言学,怎么可能做的出语气识别?

罗辑抓破脑袋也没有想出代替方案,这似乎是唯一的解决方法。

想想也是,对语言不熟悉的人又怎么做的出语义识别?作为社交白痴的罗辑,自己都听不太明白别人的话,又怎么让电脑也“听”

的懂?

学习语言学?

罗辑硬着头皮只看了一会,就感觉头大如斗,就像熬了好几个通宵,困意如潮水般一*涌来,怎么也挡不住。

这道是个催眠的好方法,罗辑有些哭笑不得。

“只能走一步看一步了。”

罗辑决定先将这个问题搁置,等其他能解决的都解决了,再回头来考虑这个问题。

先搭建模型吧。

语义解析得到步骤和前两步很想,都需要一定量的数据支持。

好在有小音的帮助,不需要罗辑去亲自搭建语料库,不然光是这一个工程就能让开发时间延长几倍。

繁琐的数据积累永远是最费时间的,不过幸好小音的智能程度提高了,她能替罗辑执行的工作也越来越多,可以说只要语义识别完成,她就和电影里的那些黑科技差不多了。

研发的过程对于别人也许是枯燥的,但对罗辑来说却是让人兴奋不已的。

因为在拥有了科技树之后,他基本不会做无用功,任何研究都有一个明确的方向,所以他的研究每时每刻都在向目标推进。

七天后,罗辑在属于自己的机房里长出了口气。

现在上他能解决问题都解决了,自动分词系统也趋于实用,至少不会出现乌龙了。

一些带有歧义的句子也能分析出来。

比如“独立自主和平等互利的原则”

本月排行榜
本周收藏榜
热门小说推荐
谍战佣兵

谍战佣兵

特种部队兵王何勇在休假期间,因为救被A国特工欺辱的女教授,而误将两特工打死一人重伤一人。上级受到压力,判处他死刑,执行枪决。师长采取李代桃僵,将何勇替换,并改名为何佳乐,派遣他去执行秘密任务,调查A国在我国内组建的第五纵队成员,配合安全部门进行打击和摧毁。期间与娃亲相认与相爱,敌特内部潜伏美女修道美女弟子爱上男主等感情纠葛。但是,为了完成任务,忍受感情折磨,最终取得胜利的曲折故事。...

合作伙伴不是人

合作伙伴不是人

路桥一心想在商业街开一家宠物店,却阴差阳错继承了儿时的福利院。...

科幻之大世界

科幻之大世界

22世纪末,因一次罕见的大地震,造成了世界百分之八十的核电站泄露,高强度的核辐射引起了一系列的生物基因突变,世界也因此而发生了巨大的变化!基因的畸形化,让的地球之上真的出现了那只存在于玄幻世界中的妖兽毒人!23世纪初,科学领域的高度发展,让人类再一次的看到了希望,人体基因的大突破,让的人类有了超强的能力,空间叠加技术的高速发展,更是人类历史上的一重大的里程碑,也因此,而真正的走向了世界!玄幻科幻都市三种类型相结合的一种新书,有都市激情,美女成群有玄幻爽文,元素逆转有科幻科技...

雇佣总裁:后会无妻

雇佣总裁:后会无妻

她当着众多人的面狠狠的给了他一巴掌,本以为他会发火,却开口问她解气了吗?你以为一巴掌就能解我这么多年的心头恨吗!她狠狠的指着自己的心口,眸子里是愤怒和悲凉,而眼泪却倔强的留在眼眶里。他看着她,原来她一直都恨着他,这么多年。而他自己却想了她这么多年,念了她这么多年。当初的徐小东是假的,说不爱你也是假的。(先甜后虐,甜到发腻,虐到你哭!一生一世只一人)...

女神重生之巨星老公

女神重生之巨星老公

她是东方家大小姐,生性孤傲,出手狠辣,在商界初出茅庐便惊艳四座,更是人见人爱的影视歌三栖女神,却为了一个伴她十年的男人,放弃一切光环,洗手作羹汤。哪知一夜之间,她被挚爱之人打入地狱,送去做人体试验,最后死无全尸。再次睁眼,她却成了继承巨额遗产,勾引自己继兄失败自杀未遂的移动小金库!天降神奇星光璀璨系统89757...

花妖成仙记

花妖成仙记

意外穿越,成为一只小妖怎么办?努力修仙,拒绝成为盘中餐。...

每日热搜小说推荐