本文來源于網頁設計愛好者web開發社區http://www.html.org.cn收集整理,歡迎訪問。 前言:由于一個客戶的項目中需要將word文檔轉換成pdf格式,故寫了本篇實站教程
需求分析:客戶的項目以b/s結構為主,提供一個word文件在后臺自動轉換成pdf,經過實際測試,如果該篇word文檔有100多頁的話,轉換需要20分鐘左右的時間(環境:cpu是奔騰m 1.6g,512m內存),整個cpu的占用率近乎95%~100%,此結果告訴客戶以后,客戶提議:到客戶下班后,自動轉換pdf,同時如果使用人確認要查看該pdf文檔,如果沒有轉換,提供給客戶選擇,是現在轉換成pdf,還是由服務器在客戶下班后,自動轉換。
項目功能:按需求分析要寫兩個功能
第一為:b/s結構后臺轉換,要提交給客戶選擇
第二為:windows服務自動轉換word文檔到pdf
這兩個分類:核心的轉換程序都是采用線程的方式執行,只不過第一個功能是針對一個word文件,第二個功能針對所有未轉換的word文檔.
分析到現在:我們開始實戰轉換了!
一:必備工具
安裝必須的工具ms vs.net2003,ms office2003,adobe acrobat 7.0 professional,postscript.exe,gs811w32.exe
ms vs.net2003的安裝不說明
ms office2003的安裝不說明
adobe acrobat 7.0 professional安裝說明
運行setup.exe文件,出現輸入序列號,就運行注冊機,用鼠標在第一行刷下就可以看見序列號,復制粘貼到adobe acrobat 7.0 professional安裝程序對話框,安裝到最后出現注冊時,點擊phone...將安裝程序中顯示的第二行序列號(第一行是剛才注冊機生成的序列號)復制粘貼到注冊機的第二行,點擊右邊的按鈕,再用鼠標刷第三行授權號就出來了,將其復制粘貼到安裝程序的最后一行,完成安裝注冊!
postscript.exe默認安裝就可以了,它是一個pdf轉換時所需要的腳本
gs811w32.exe默認安裝就可以,它其實是個pdf虛擬打印機的驅動
二:配置虛擬打印機
進入windows的控制面板,進入打印機,點擊"添加打印機"圖標.在安裝對話框上"按一步",出現選擇打印機時,在制造商一欄中選擇"generic",在打印機一欄中,選擇"ms publisher color printer",然后一路按下一步,知道安裝結束.
三:開始寫第一個程序(腳本程序)
為什么要使用腳本程序進行轉換呢,其實實際測試過程中,使用pdf distiller的對象引用到c#后,轉換成功,但整個pdf distiller對象不能釋放,第二次再轉換時,就發生了錯誤,故此處使用腳本程序實現轉換.這樣我們只要在c#的程序中調用腳本程序就可以實現word到pdf的轉換。
宿主腳本文件名:convertdoc2pdf.js
腳本文件內容:
var files = wscript.arguments;
var fso = new activexobject("scripting.filesystemobject");
var word = new activexobject("word.application");
var pdf = new activexobject("pdfdistiller.pdfdistiller.1");
word.activeprinter = "ms publisher color printer";
//files(0) 為word文檔文件名
//files(1) 為,轉換后需要保存的路徑
//調用fso.getbasename(files(0))后,為無路徑,無擴展名,的文件名
//files.length為文件參數的個數,使用循環可以支持多個word文檔的轉換
var docfile = files(0);
var psfile = files(1) + fso.getbasename(files(0)) + ".ps";
var pdffile = files(1) + fso.getbasename(files(0)) + ".pdf";
var logfile = files(1) + fso.getbasename(files(0)) + ".log";
try{
var doc = word.documents.open(docfile);
//word文件轉成ps文件;
word.printout(false, false, 0, psfile);
doc.close(0);
//ps文件轉成pdf文件;
pdf.filetopdf(psfile,pdffile,"");
fso.getfile(psfile).delete();//刪除ps腳本文件
fso.getfile(logfile).delete();//刪除轉換的日志文件
word.quit();
wscript.echo("isuccess");//成功
wscript.quit(0);
}
catch(x)
{
word.quit();
wscript.echo("isfail");//失敗
wscript.quit(0);
}
然后測試該腳本程序
啟動ms-dos,輸入如下命令:
c:/>cscript //nologo c:/convertdoc2pdf.js c:/test.doc c:/
說明:
運行成功后將看到test.pdf文檔了
c:/test.doc參數對應的是腳本程序中的files(0)
c:/參數對應的是腳本程序中的files(1)
你可以安照該腳本改寫成,支持多個參數,使用for循環,一次轉換多個word文檔,此處沒有使用多個文件轉換功能,是考慮到,該段腳本放在c#的線程中執行,這樣一來也可以轉換多個word文檔.
四:使用c#調用convertdoc2pdf.js腳本
新建一個c#的windows應用程序,添加一個按鈕button1
添加一個函數,函數名startconvertpdf
public void startconvertpdf()
{
process proc = new process();
proc.startinfo.filename = "cmd.exe";
proc.startinfo.workingdirectory = @"c:/";
proc.startinfo.createnowindow = true;
proc.startinfo.useshellexecute = false;
proc.startinfo.redirectstandardinput = true; //輸入重定向
proc.start();
proc.standardinput.writeline(@"cscript //nologo c:/convertdoc2pdf.js c:/test.doc c:/");
proc.standardinput.writeline("exit");
proc.waitforexit();
}
然后在按鈕的click事件中添加調用線程的代碼
private void button1_click(object sender, system.eventargs e)
{
//定義線程序
thread thconvert = new thread(new threadstart(startconvertdata));
thconvert.start();
}
注意:在測試上面的c#程序時,必須添加如下命名空間
using system.diagnostics;
using system.threading;
五:健壯的c#調用代碼(實際考慮,可放在b/s系統中)
完成第4步的c#測試后,細心的讀者,可能看到一點問題,那就是如何得到腳本運行后輸出的結果,如何給線程中調用的startconvertdata方法傳遞參數
1:傳遞參數,此話說來也可用一篇教程告訴大家線程中方法如何來傳遞參數,現在就講一個方案,此種方案很多,我采用一個類,初始化這個類,然后調用該類的方法作為線程執行的方法
2:得到腳本的輸出結果,使用process對象的輸出重定向,就是說改變輸出方向,使腳本不輸出到控制臺(ms-dos窗口),而是重定向輸出到c#程序中,并采用線程的異步回調方法,顯示腳本運行結果。
添加一個新類,類名為topdf
using system;
using system.diagnostics;
using system.componentmodel;
using system.windows.forms;
using system.data;
namespace doc2pdf
{
public class topdf
{
private string strword = "";//此處的word文件不含路徑
private string spath = "";
public string sexecresult = "";
public bool bsuccess = false;
public topdf(string sparamword,string sparampath)
{
strword = sparamword;
spath = sparampath;
}
public void startconvertpdf()
{
process proc = new process();
proc.startinfo.filename = "cmd.exe";
proc.startinfo.workingdirectory = spath;
proc.startinfo.createnowindow = true;
proc.startinfo.useshellexecute = false;
proc.startinfo.redirectstandardinput = true;//標準輸入重定向
proc.startinfo.redirectstandardoutput = true;//標準輸出重定向
proc.start();
proc.standardinput.writeline("cscript //nologo "+spath+"convertdoc2pdf.js "+spath+strword+ " "+spath);
proc.standardinput.writeline("exit");
sexecresult = proc.standardoutput.readtoend();//返回腳本執行的結果
proc.waitforexit();
proc.close();
}
public void endconvertpdf(system.iasyncresult ar)//ar參數必須寫,是線程執行完成后的回調函數
{
if(sexecresult.indexof("isuccess")!=-1)bsuccess=true;
else if(sexecresult.indexof("isfail")!=-1)bsuccess=false;
//如果放在b/s系統,你可以在此處寫數據庫,是成功還是失敗,并用一個webservice程序不斷檢查數據庫,此webservice程序不放在該回調用函數中
//如果放在c/s系統,回調函數可以不放在類中,以便在窗體程序中調用結果
}
}
}
改寫原來的button1_click事件中的代碼
private void button1_click(object sender, system.eventargs e)
{
topdf my2pdf = new topdf("test.doc","c://");
threadstart thstartconvert = new threadstart(my2pdf.startconvertpdf); //開始異步調用線程
thstartconvert.begininvoke(new asynccallback(my2pdf.endconvertpdf),null);//設置異步線程的回調函數
//如果需要轉換多個word,你可以用循環
//如果是b/s系統,可以將本段代碼放在aspx中,并結合客戶端的無刷新顯示數據的技術,不斷訪問webservice程序,以確定pdf是否轉換成功或失敗
}
六:編寫更加健壯的c#調用代碼(實際考慮,可放在windows的服務程序中)
實際使用時,由于轉化pdf時cpu的占用率很高,考慮只在同一時間轉換一篇word文檔,放棄異步線程的回調函數的使用,考慮一個windows的服務程序。
寫一個函數checkdata2convert(),不斷的檢查沒有轉換的word文檔,并使用循環調用topdf類中執行轉換方法startconvertpdf
//以下給出,泛代碼,用戶按照自己的需求,填寫完整即可
//bool bstart為全局變量,控制循環的進入與退出
//例:18:30開始檢查并轉換,那么18:30時,bstart=true;并啟動轉換線程
//6:30停止轉換線程,bstart=fasle;
private void checkdata2convert()
{
//檢查指定目錄下的沒有轉換的word文檔,你同樣可以檢查數據庫中記錄的沒有轉換的word文檔
string spath = system.threading.thread.getdomain().basedirectory; //當前的路徑
while(bstart)
{
int ifilecount = checkword(); //checkword為一個方法,檢查當前沒有轉換的word文檔,返回沒有轉換的文件數,該方法的代碼由讀者自己編寫
for(int i=0;i<ifilecount;i++)
{
string sword = getwordfilename(i) //getwordfilename為一個方法,返回一個不帶路徑的word文件名,該方法的代碼由讀者自己編寫
//topdf類中的startconvertpdf()方法使用的是不帶路徑的word文件名
topdf my2pdf = new topdf(sword ,spath);
my2pdf.startconvertpdf();
if(my2pdf.sexecresult.indexof("isuccess")!=-1)
{
//成功,寫日志,或回寫數據庫
}
else if(my2pdf.sexecresult.indexof("isfail")!=-1)
{
//失敗,寫日志,或回寫數據庫
}
}
if(!bstart)break;
thread.sleep(1000);
}
}
然后在服務的開始事件中,啟動線程
protected override void onstart(string[] args)
{
//可以使用一個開始定時器,檢查是否到開始時間,時間一到,就開始執行線程,此處的開始執行線程可以放在開始定時事件中
//可以使用一個結束定時器,檢查是否到結束時間,時間一到,就結束線程,結束線程的代碼可以放在結束定時事件中
//注意:應該使用組件中的定時器,而不是windows的forms中的定時器
//該定時器的類名為system.timers.timer,千萬別搞錯,不然執行不會正常的
bstart = true;
thread thconvert = new thread(new threadstart(startconvertdata));
thconvert.start();
}
然后在服務的結束事件中,設置停止線程的標識bstart= false
protected override void onstop()
{
bstart = false;
//為何次處不停止線程呢,因為考慮到,現在線程正在轉換word文檔,但沒有結束,所以只設置停止標識,轉換完成后,線程也執行結束了.
}
結束語:
adobe acrobat 7.0 professional,postscript.exe,gs811w32.exe這三個文件可以在itbaby.jss.cn下載,都包含在同一個rar的壓縮文件中了。
itbaby.jss.cn是動態域名,主機在作者家里,如果網站不能訪問,說明電腦沒有開,請稍后幾天再試。