wordnet-php

需求很简单,解决很粗暴。

把wordnet db file导入到mysql数据库中

文件分为两种,
index.* 索引文件 除了index.sense
data.* 数据文件
所以,表也就两个。
但是,wordnet有*.exc文件,也就是单词的变形。在我这,这个需求被砍了。。。被砍的还有上下位词啊什么语义语素方面的东西,那些单词没有中文解释。。不过,sql表结构还是遵从源文件的数据格式的,所以数据没有缺失。
嗯,只关注了这两种文件,所以那些语义语素之类的暂时抛弃了。

读文件,按空格切成数组,读字段,生成sql插入语句,执行插入。
因为需要大量插入,所以,调大了max_allowed_packet,表使用InnoDB引擎。插入效率棒棒哒。
这只是整理数据,具体的界面还没有放到github上。
上代码,TL;DR

项目地址 http://github.com/sleepm/wordnet-php

发布者

gt

QQ: 1520667045 一个名叫坏人的博客,他很想成为WEB攻城狮,因为他认为每个前端开发者的审美观都是很挑的……

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据