用户画像精准平台系统的实践
1.从百度地图的POI数据库中抓取该城市的所有公司名称和学校名称,进行切分,并手动编写规则对切分结果进行处理,转化为角色标注序列。
2.收集所有的单词和字符得到一个字符字典,去掉字符的后缀来训练相应的NGram模型。
3.收集角色标注序列中的所有角色序列,并制定规则集。
4.对于一个输入的订单地址,首先用角色字典标记,然后用对应的词缀NGram回忆,得到一个角色标记序列。对于角色标注序列,是满足上述规则集的命名实体。
关注私信回复「用户画像」's免费获取用户画像及精准平台系统实践PDF