国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > regex > 正文

MongoDB正則表達(dá)式及應(yīng)用

2020-01-20 22:08:22
字體:
供稿:網(wǎng)友

正則表達(dá)式常用來在所有語言中搜索字符串的任何模式或文字。MongoDB還提供了正則表達(dá)式功能的字符串模式使用正則表達(dá)式$regex操作符。MongoDB使用PCRE(Perl兼容正則表達(dá)式)為正則表達(dá)式語言。

不同于文本搜索,我們不需要做任何配置或命令就能直接使用正則表達(dá)式。

考慮下包含文字后其標(biāo)簽的帖子集合,文檔結(jié)構(gòu)如以下:

{ "post_text": "enjoy the mongodb articles on yiibai", "tags": [  "mongodb",  "yiibai" ]}

使用正則表達(dá)式表達(dá)

下面的正則表達(dá)式查詢搜索所有包含字符串 yiibai.com 的帖子:

復(fù)制代碼 代碼如下:

>db.posts.find({post_text:{$regex:"yiibai.com"}})

同樣的查詢也可以寫為:

>db.posts.find({post_text:/yiibai.com/})

使用正則表達(dá)式不區(qū)分大小寫

為了使搜索不區(qū)分大小寫,我們使用$options 帶有值參數(shù) $i。下面的命令會(huì)搜索字符串:yiibai.com,不論大小寫:

復(fù)制代碼 代碼如下:

>db.posts.find({post_text:{$regex:"yiibai",$options:"$i"}})

該查詢重新調(diào)整的結(jié)果是:其中在大小下包含詞語 yiibai 文檔,如以下:

{ "_id" : ObjectId("53493d37d852429c10000004"), "post_text" : "hey! this is my post on Yiibai",  "tags" : [ "yiibai" ]} 

使用正則表達(dá)式的數(shù)組元素:

我們還可以使用數(shù)組字段正則表達(dá)式概念。 這時(shí)候我們實(shí)現(xiàn)標(biāo)簽的功能顯得尤為重要。 所以,如果想要搜索帶有標(biāo)簽以詞組tutorial開始所有的帖子(無論是tutorial或tutorials或tutorialjava或tutorialphp),都可以使用下面的代碼:

復(fù)制代碼 代碼如下:

>db.posts.find({tags:{$regex:"tutorial"}})

優(yōu)化正則表達(dá)式查詢:

如果文檔字段已被索引,查詢將使用使用索引值的匹配正則表達(dá)式。 這使得搜索非常快,正則表達(dá)式相對于掃描整個(gè)集合。

如果正則表達(dá)式是一個(gè)前綴表達(dá)式,所有的匹配是以某一串字符開始。例如,如果正則表達(dá)式 ^tut, 查詢有只搜索那些開始串 tut.

mongodb正則表達(dá)式應(yīng)用

mongodb中完全支持正則表達(dá)式,一般查詢中可以使用操作符$regex

db.lnmopy.find( { 'name': /*.lnmopy.com/i } )db.lnmopy.find( { 'name': { $regex: '*.lnmopy.com', $options: 'i' } } )

以上兩種完全等價(jià),可以直接對域(field)即上例中的'name'鍵,使用正則表達(dá)式或者使用操作符,可選項(xiàng)目是i,即忽略大小寫。
關(guān)于正則可選項(xiàng),mongodb和其他語言標(biāo)準(zhǔn)正則稍有不同,有自己的標(biāo)準(zhǔn)。

$options的可選值

i 忽略大小寫;

m 多行查找,如果內(nèi)容里面不存在換行符號(例如 /n)或者構(gòu)造上沒有(start/end),該選項(xiàng)沒有任何效果;
x 空白字符除了被轉(zhuǎn)義的或在字符類中的以外完全被忽略,在未轉(zhuǎn)義的字符類之外的 # 以及下一個(gè)換行符之間的所有字符,包括兩頭,也都被忽略;

s 圓點(diǎn)元字符(.)匹配所有的字符,包括換行符

假設(shè)我們有一個(gè)數(shù)據(jù)庫名為mongoDemo

use mongoDemo

數(shù)據(jù)庫中有個(gè)集合名為lnmopy

db.lnmopy.find()

有如下數(shù)據(jù):

{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "demo.lnmopy.com", "site" : "unknown", "tag" : "d,e,m,o"}
{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "welcome.lnmopy.com", "site" : "website", "tag" : "w,e,l,c,o,m,e"}

mongodb的正則表達(dá)式僅支持i和m的javascript原生寫法(如/*.lnmopy.com/i)。如果要是用x和s選項(xiàng)就必須使用“$regex”操作符并在“$options”中指定選項(xiàng)。

使用正則表達(dá)式的更新操作:

db.lnmopy.update( { 'name': /*.lnmopy.com/i }, { $set: { 'site':'www.lnmopy.com' } } );

意思是,查找當(dāng)前數(shù)據(jù)庫中名為“l(fā)nmopy”的集合中“name”字段符合“/*.lnmopy.com/i”正則的條目,并只將“site”字段更新為“www.lnmopy.com”,該條更新語句僅更新一條數(shù)據(jù),如果不是用$set,那么這條記錄就會(huì)只剩下你更新的部分和默認(rèn)的ObjectId,可以說是替換了。如果想替換所有,可以加入?yún)?shù):

db.lnmopy.update( { 'name': /*.lnmopy.com/i }, { $set: { 'site':'www.lnmopy.com' } } , false, true);

參數(shù)有順序,false是upsert,如果沒有就插入新的。true就是multi多條記錄更新,所有匹配到的結(jié)果?;蛘咧苯又付▄ multi: true }:
db.lnmopy.update( { 'name': /*.lnmopy.com/i }, { $set: { 'site':'www.lnmopy.com' } } , { multi: true });
這樣就把所有的“site”字段全都更新為“www.lnmopy.com”了。

我設(shè)計(jì)的字段“tag”有個(gè)缺陷,就是本來是一個(gè)單詞,現(xiàn)在每個(gè)字母都被“,“分隔開了。實(shí)際工作中也存在類似問題,由于批量轉(zhuǎn)換數(shù)據(jù),或者其他程序操作不當(dāng),或者業(yè)務(wù)需求更改等等原因需要對某些字段進(jìn)行正則批量處理,mongodb的一般更新方法是不能實(shí)現(xiàn)的,這時(shí)就需要使用javascript語句。

正則表達(dá)式替換查詢結(jié)果中','為”

db.lnmopy.find().forEach( function(u) { u.tag = u.tag.replace(//,/, ""); db.lnmopy.save(u); } );

最后執(zhí)行

db.lnmopy.find()

顯示如下數(shù)據(jù):

{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "demo.lnmopy.com", "site" : "{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "welcome.lnmopy.com", "site" : "

后記:javascript是mongodb的一大特色,也是優(yōu)勢,很多復(fù)雜的查詢和處理都可以用javascript實(shí)現(xiàn),要注意的是,javascript的工作效率較低,原則上應(yīng)該盡量避免在主要業(yè)務(wù)邏輯中大量使用。類比的講,javascript就相當(dāng)于oracle的存儲(chǔ)過程,介于10gen(mongodb的開發(fā)團(tuán)隊(duì))是由oracle出來的這點(diǎn),就一點(diǎn)也不奇怪了。關(guān)于如何使用更復(fù)雜的javascript,以后會(huì)寫到。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 县级市| 偃师市| 旺苍县| 新龙县| 平定县| 常熟市| 嘉善县| 崇州市| 嘉祥县| 岫岩| 从化市| 奉贤区| 儋州市| 蕲春县| 加查县| 商丘市| 东乡县| 渑池县| 宜春市| 乌兰浩特市| 龙州县| 武冈市| 扎鲁特旗| 密云县| 武定县| 枞阳县| 兴仁县| 临桂县| 峨眉山市| 屯留县| 溧水县| 巴林左旗| 丽水市| 大洼县| 建德市| 斗六市| 道孚县| 财经| 通辽市| 安阳县| 昭通市|