博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
关于手机等品牌型号搜索与采集的中文分词分离
阅读量:6551 次
发布时间:2019-06-24

本文共 1006 字,大约阅读时间需要 3 分钟。

很久以前,写过一个手机的搜索查询,这里要涉及到手机类型和型号的分离。

很久之后前,有人问起这个问题,于是,写点说明就把这函数的草稿发布了,并写下了这一些说明。

函数说明,如搜索输入:诺基亚N95,将被拆分成品牌:诺基亚 型号:N95

对于手机数据采集,也可以用这函数分离出品牌和型号。

SetSearchKey(
"
诺基亚N95
"
,
out
 诺基亚,
out
 N95);

 

函数代码如下:

 

protected
 
void
 SetSearchKey(
string
 keyword, 
out
 
string
 goodsName, 
out
 
string
 goodsModel)
        {
            keyword 
=
 keyword.ToLower().Trim();
            
if
 (keyword.Contains(
"
 
"
))
//
带空格,分离
            {
                goodsName 
=
 keyword.Split(
'
 
'
)[
0
].Trim();
                goodsModel 
=
 keyword.Split(
'
 
'
)[
1
].Trim();
            }
            
else
 
if
 (Regex.Match(keyword, 
@"
^[\u4E00-\u9FA5]+[\w\d]+
"
).Success)
//
以中文开头,包含英文,分离
            {
                goodsName 
=
 Regex.Match(keyword, 
@"
^([\u4E00-\u9FA5]+)[\w\d]+
"
).Groups[
1
].Value;
                goodsModel 
=
 keyword.Replace(goodsName, 
string
.Empty);
            }
            
else
            {
                
string
[] keys 
=
 
new
 
string
[] { 
"
nec
"
"
lg
"
"
vk
"
"
cect
"
 };
                
for
 (
int
 i 
=
 
0
; i 
<
 keys.Length; i
++
)
                {
                    
if
 (keyword.IndexOf(keys[i]) 
==
 
0
)
                    {
                        goodsName 
=
 keys[i];
                        goodsModel 
=
 goodsModel 
=
 keyword.Replace(goodsName, 
string
.Empty);
                        
return
;
                    }
                }
                goodsName 
=
 keyword;
                goodsModel 
=
 keyword;
            }
        }

 

 

转载地址:http://qafco.baihongyu.com/

你可能感兴趣的文章
redis cluster
查看>>
HDU 3435A new Graph Game(网络流之最小费用流)
查看>>
newlisp 注释生成文档
查看>>
MySQL float 与decimal 各中的区别。
查看>>
SQL常用函数之五 str()
查看>>
NASA从太空发射激光,制作地球森林高度地图
查看>>
MongoDB
查看>>
别人封装的socket
查看>>
PHP中set_magic_quotes_runtime()和get_magic_quotes_gpc()
查看>>
AWK 介绍
查看>>
The sound of silence引发的关于互联网以及教育的利弊思考
查看>>
普华永道全球CEO报告:巴西企业家对未来预期改善
查看>>
铁路“货车医生”在看不见的春运“战场”坚守岗位
查看>>
中汽协预计:2019年中国汽车市场销量约为2810万辆
查看>>
自制Kindle电子书转化的实用技巧
查看>>
PyCon 2018:Facebook如何在4年间全面转向Python3?
查看>>
浅谈前端模块化
查看>>
Flutter 布局(三)- FittedBox、AspectRatio、ConstrainedBox详解
查看>>
CSS 层叠相关知识指北
查看>>
一个简单前端工具集-yanjs
查看>>