国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 數(shù)據(jù)庫(kù) > SQL Server > 正文

使用SQL Server導(dǎo)入和索引 Microsoft Word 文檔

2024-08-31 00:50:31
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

問(wèn):我需要將Microsoft Word文檔導(dǎo)入至SQL Server并索引這些文檔,以便在關(guān)系查詢中使用這些文檔。怎樣導(dǎo)入和索引文檔呢?

答:SQL Server允許您以多種方式導(dǎo)入Word文檔。讓我們看看幾種最常用的方法。請(qǐng)注意,在將文檔導(dǎo)入至SQL Server之前,您需要?jiǎng)?chuàng)建一個(gè)image數(shù)據(jù)類型列,用于存放數(shù)據(jù)。然后,您可以使用textcopy.exe命令行工具將image文件讀入數(shù)據(jù)庫(kù),從而完成文檔的導(dǎo)入操作。如果需要該工具的基本說(shuō)明文檔,請(qǐng)?jiān)诿钐崾緺顟B(tài)下鍵入textcopy /?。將Word文檔導(dǎo)入SQL Server的另一個(gè)方法是使用Microsoft ActiveX Directory Object(ADO)Stream接口編寫導(dǎo)入代碼。您可以在Microsoft產(chǎn)品支持服務(wù)(PSS)的通過(guò)使用ADO Stream對(duì)象訪問(wèn)和修改SQL Server BLOB數(shù)據(jù)一文中找到示例代碼。

此外,您也可以將二進(jìn)制數(shù)據(jù)移到SQL Server中。有關(guān)這一方法的詳細(xì)說(shuō)明,請(qǐng)參閱PSS的使用ADO檢索和更新SQL Server文本域一文。移動(dòng)二進(jìn)制數(shù)據(jù)允許您將數(shù)據(jù)的一部分存放在數(shù)據(jù)庫(kù)中,這在需要控制數(shù)據(jù)格式時(shí)尤其有用。例如,如果只需要數(shù)據(jù)中1,000到1,010之間的字節(jié),導(dǎo)入二進(jìn)制數(shù)據(jù)的速度遠(yuǎn)遠(yuǎn)高于使用ADO Stream接口的速度,這是由于SQL Server從磁盤上檢索數(shù)據(jù)的量大為減少。人們通常使用這一技術(shù)來(lái)存儲(chǔ)位掩碼,用于表示應(yīng)用程序的開(kāi)或關(guān)標(biāo)志位。

SQL Server 2000自帶了說(shuō)明了如何移動(dòng)二進(jìn)制數(shù)據(jù)的示例代碼。如需查看該代碼,只需在安裝有SQL Server 2000光盤上代碼示例的驅(qū)動(dòng)器上選擇 /PRogram Files/Microsoft SQL Server/80/Tools/DevTools/Samples/ado路徑。展開(kāi)該可執(zhí)行文件,在Visual Basic目錄下查找Samples子目錄。在Employee示例下,注意一下該代碼是如何使用FillDataFields()函數(shù)的。

如需索引Word文檔,SQL Server 7.0和SQL Server 2000都提供了全文搜索組件。該組件混合使用了多種技術(shù),用以索引大型文本和image列。在執(zhí)行全文搜索時(shí),您需要指定image列所含的文件類型,以及從二進(jìn)制數(shù)據(jù)中析取信息所需的篩選(filter)。有關(guān)使用全文索引的詳細(xì)信息,請(qǐng)參閱SQL Server在線書(shū)籍中的相關(guān)主題,并閱讀David Jones 2000年7月發(fā)表在SQL Server雜志網(wǎng)站上的名為構(gòu)建更好的搜索引擎一文。請(qǐng)注意,索引Word文檔并不會(huì)自動(dòng)生成包含文檔中關(guān)鍵字的一組關(guān)系表。但是,索引文件讓您將這些Word文檔包含在您的搜索中。以下是從數(shù)據(jù)中析取關(guān)鍵字的可行方式:

使用OLE自動(dòng)處理從文檔中讀取用戶定義的關(guān)鍵字。在裝載該文檔時(shí)將這些關(guān)鍵字保存在關(guān)系表中。
使用OLE自動(dòng)處理打開(kāi)文檔并將其保存為文本(.txt)格式。為了析取重要的詞語(yǔ),您可以使用自己的“詞語(yǔ)分析器”遍歷該文本文件。文字分析器查看文檔中的每個(gè)詞語(yǔ),去除一些無(wú)用文字,并將每個(gè)唯一的詞語(yǔ)與其出現(xiàn)的次數(shù)一道存儲(chǔ)起來(lái)。
在新的全文索引文檔中搜索特定的關(guān)鍵字,并將這些關(guān)鍵字輸入到關(guān)系表中。
SQL Server 2000提供了多個(gè)強(qiáng)大的工具和接口,用于幫助用戶實(shí)現(xiàn)二進(jìn)制Microsoft Office文檔的快速裝載、搜索和檢索。

 


發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 兴安县| 汕头市| 句容市| 桃园县| 青冈县| 东安县| 金门县| 开封县| 双辽市| 安乡县| 雷山县| 佳木斯市| 赤壁市| 屯留县| 庐江县| 信阳市| 灵丘县| 嵊州市| 文成县| 长治县| 元谋县| 确山县| 金华市| 新平| 彭山县| 呼和浩特市| 类乌齐县| 滨州市| 上思县| 广灵县| 福鼎市| 奉贤区| 焦作市| 远安县| 平塘县| 南昌市| 米林县| 稷山县| 麻城市| 夹江县| 疏勒县|