日本一区二区免费播放_麻豆导航_久久精品99_国产性av_色婷婷噜噜久久国产精品12p_av福利资源_精品综合久久

當(dāng)前位置:首頁 > 網(wǎng)站舊欄目 > 學(xué)習(xí)園地 > 程序開發(fā)教程 > IHTMLDocument2接口訪問Dom,完成自動(dòng)搜索

IHTMLDocument2接口訪問Dom,完成自動(dòng)搜索
2009-12-23 10:57:24  作者:cnblogs  來源:cnblogs

首先感嘆下:冬至了,別人都去聚餐言歡,我去孤獨(dú)寫這些文字

 之所以寫這個(gè)東西,是一個(gè)網(wǎng)管朋友出50元大洋讓我寫的,有了這個(gè)東東,在網(wǎng)吧可以很輕松的做網(wǎng)吧增值廣告了.當(dāng)時(shí)是星期天,想著又沒有事做,就答應(yīng)了,雖知星期天的事情還真多,知道昨天晚上才搞定.

 我們來看下這位朋友的要求:

1、網(wǎng)站址:http://www.v232.com/?username,后面的username最好能在配置文件中配置。

2、打開軟件后搜索一次(搜索關(guān)鍵詞最好從我那網(wǎng)站調(diào)用,因?yàn)槲夷蔷W(wǎng)站的關(guān)鍵字是隨機(jī)網(wǎng)絡(luò)熱門關(guān)鍵字地址是http://61.187.248.172:8099/listc.do這個(gè)地址最好也能配置,因?yàn)橛袝r(shí)會(huì)變)
3、搜索一次后還必須要點(diǎn)擊一次搜索到的結(jié)果,不然會(huì)視為無效搜索。
4、等上幾秒(最好可以通過配置文件配置)再運(yùn)行一次搜索即可,當(dāng)然最好能讓他運(yùn)行三次,運(yùn)行三次后還是等上幾十分鐘(最好能配置)再運(yùn)行。
5、全后臺(tái)運(yùn)行,不能移動(dòng)改變鼠標(biāo)位置。

 

一條條分析下:

第一個(gè)要求,too easy ,編程花費(fèi)時(shí)間可以忽略不計(jì),用ini文件,用GetPrivateProfile**的api搞定

第二個(gè)要求:分兩步,

          (1)獲取關(guān)鍵字,CInternetSession + CHttpFile后再截取字符串搞定(當(dāng)然換了地址,代碼換了就不行了)

          (2)搜索一次,這個(gè)一次搜索,過程也是比較難搞的,大家可以打開那個(gè)http://www.v232.com/?username這個(gè)網(wǎng)站其實(shí)用搜狗的廣告聯(lián)盟,過程挺簡(jiǎn)單的,給搜索框填寫關(guān)鍵字,然后單擊搜索按鈕,這里起初我想的也是很簡(jiǎn)單的,可是問題確實(shí)不斷的出來,不過最終都解決了,要不我也不敢在這些這些字了,呵呵

         這個(gè)過程要用本文的主角IHMLDocument2了,而且還用到了跨域訪問,可以看那個(gè)網(wǎng)站,是把搜狗網(wǎng)站用iframe引進(jìn)來了,兩個(gè)document屬于不同的域,訪問就不便了,這個(gè)接口竟然也有這種限制.不過不用怕,網(wǎng)頁都到自己的電腦上了,自己的電腦,難道還不聽自己的話么.如果真是這樣我寧愿把電腦砸了.

第三個(gè)要求:沒什么了,第二個(gè)要求中的差不多,其實(shí)應(yīng)該還簡(jiǎn)單的,因?yàn)樗阉鹘Y(jié)果是一個(gè)框架的,而且又沒有跨域的問題.不過唯一不好的就是搜索結(jié)果的鏈接默認(rèn)是在新窗口打開的,這樣的話,這個(gè)軟件就不能夠足夠的隱藏了,因?yàn)闀?huì)打開一個(gè)新的瀏覽器窗口了,解決辦法,就是在當(dāng)前打開了,所以更改鏈接的target屬性.

第四個(gè)要求:用SetTimer搞定即可.

第五個(gè)要求:沒什么了,隱藏對(duì)話框窗口.

先搞個(gè)圖片:

下面就開始主演登場(chǎng)了

 

首先盜用別人的一張圖來展示下網(wǎng)頁的結(jié)構(gòu)

 

[page]
我用的是VS2008中的activeX Microsoft web browser控件所以可以很容易獲取到IHTMLDocument2對(duì)象

m_ie是與activeX Microsoft web browser控件關(guān)聯(lián)的變量,CComPtr是Com了,可以實(shí)現(xiàn)智能指針

代碼
CComPtr<IDispatch> spDispDoc = m_ie.get_Document();
    CComPtr
<IHTMLDocument2> spHtmlDoc = NULL;
    hr 
= spDispDoc->QueryInterface(IID_IHTMLDocument2,(void **)&spHtmlDoc);
    
if (FAILED(hr) || NULL == spHtmlDoc)
    {
        
//return FALSE;
    }

 

 

上面在分析中說了要第二個(gè)要求中,有框架的,還要跨域的,可以看上圖,我們知道對(duì)已訪問框架網(wǎng)頁的IHtmlDocument2,我們需要要獲取Frame對(duì)象,然后是Window對(duì)象,然后再次才是框架網(wǎng)頁的IHTMLDocument2對(duì)象.

所以就按此順序來了

 

代碼
    spHtmlDoc->get_readyState(&state); 
        pSate 
= _com_util::ConvertBSTRToString(state);
        
if(strcmp(pSate,"complete")==0//檢測(cè)下狀態(tài)
        {
            
        }
        
else
        {
            
return;
        }
        
//開始解析網(wǎng)頁
        CComPtr<IHTMLWindow2>  pHTMLWnd = NULL;   
        CComPtr
<IHTMLDocument2> pChilDoc = NULL;
        LPDISPATCH   lpDispatch;   

        
        CComPtr
<IHTMLFramesCollection2> pFrames=NULL;
        spHtmlDoc
->get_frames(&pFrames);
        
long frameCount = 0;
        pFrames
->get_length(&frameCount);
        
//獲取第一個(gè)frame
        VARIANT   varindex,varresult;  
        varresult.vt
=VT_DISPATCH;   
        varindex.vt   
=   VT_I4;
        
        varindex.lVal 
= 0;
        hr 
= pFrames->item(&varindex,   &varresult);
        
if (S_OK != hr)
        {
            
return;
        }

        lpDispatch 
= (LPDISPATCH)varresult.ppdispVal;//為了跨域訪問
        if(SUCCEEDED(lpDispatch->QueryInterface(IID_IHTMLWindow2,   (LPVOID   *)&pHTMLWnd)))   
        {   
             pChilDoc 
= HtmlWindowToHtmlDocument(pHTMLWnd); //為了跨域訪問,此函數(shù)突破跨域限制
             if (pChilDoc==NULL)
             {
                 
return;
             }
        }
        
else
        {
            
return;
        }

 

做這些訪問操作,需要多加判斷,或者用try catch了.

主要是這個(gè)IDispatch,剛才我也弄得頭暈了,后來就明白了,可以把這個(gè)看成對(duì)封裝一大堆元素東西的結(jié)構(gòu),就像我們?cè)L問Document中的元素,一次得到都是封裝的,這個(gè)IDsipach可以返回我們想要的,記得用get_all,get_frames,get_forms等返回的都是一塊東西,我們沒有辦法直接訪問,然后有一個(gè)專門拆包的人,我們說要個(gè)input元素,然后這個(gè)人就到包里找,找到了就給我們,找不到了,就不進(jìn)行操作了.就像我高中學(xué)校里的傳達(dá)室一樣,每次都有很多郵件在一個(gè)箱子里,我沒有權(quán)利去檢查里面有沒有我或者我同學(xué)的信,我每次都得問那老爺爺有沒有"誰誰誰"的信,老爺爺在里面找半天,有了就給我,沒了,也不理我,繼續(xù)給其他同學(xué)找信.

傳達(dá)室就像一個(gè)Document對(duì)象,而箱子就是一些元素的集合,老爺爺就是IDispatch了,信和郵件就是我們要的網(wǎng)頁元素了,像a input table等.

上面的代碼中有突破跨域的,其實(shí)也是很實(shí)用的,這個(gè)傳達(dá)室沒有我的郵件,我得到另一個(gè)找找看了,不能吊死到一棵樹上呀

上面用到得HtmlWindowToHtmlDocument函數(shù)是從MSDN的forum上找到得,經(jīng)過我稍微的改版,改成適合我當(dāng)前工程的函數(shù),下面貼出來了

 

代碼
CComPtr<IWebBrowser2> CTimerSerachDlg::HtmlWindowToHtmlWebBrowser(CComPtr<IHTMLWindow2> spWindow)
{     
    ATLASSERT(spWindow 
!= NULL);     
    CComQIPtr
<IServiceProvider>  spServiceProvider = spWindow;     
    
if (spServiceProvider == NULL)     
    {          
        
return CComPtr<IWebBrowser2>();     
    }     
    CComPtr
<IWebBrowser2> spWebBrws;     
    HRESULT hRes 
= spServiceProvider->QueryService(IID_IWebBrowserApp, IID_IWebBrowser2, (void**)&spWebBrws);     
    
if (hRes != S_OK)     
    {          
        
return CComPtr<IWebBrowser2>();     
    }     
    
return spWebBrws;
}

// Converts a IHTMLWindow2 object to a IHTMLDocument2. Returns NULL in case of failure.
// It takes into account accessing the DOM across frames loaded from different domains.
CComPtr<IHTMLDocument2> CTimerSerachDlg::HtmlWindowToHtmlDocument(CComPtr<IHTMLWindow2> spWindow)
{     
    ATLASSERT(spWindow 
!= NULL);     
    CComPtr
<IHTMLDocument2> spDocument;     
    HRESULT hRes 
= spWindow->get_document(&spDocument);         
    
if ((S_OK == hRes) && (spDocument != NULL))     
    {          
        
// The html document was properly retrieved.          
        return spDocument;     
    }     
    
// hRes could be E_ACCESSDENIED that means a security restriction that     
    
// prevents scripting across frames that loads documents from different internet domains.     
    CComPtr<IWebBrowser2>  spBrws = HtmlWindowToHtmlWebBrowser(spWindow);     
    
if (spBrws == NULL)     
    {         
        
return CComPtr<IHTMLDocument2>();     
    }     
    
// Get the document object from the IWebBrowser2 object.     
    CComPtr<IDispatch> spDisp;     hRes = spBrws->get_Document(&spDisp);    
    spDocument 
= spDisp;     
    
return spDocument;
}

 

英文注釋都保留了,原理就是同window來獲取Document對(duì)象了,我早說了,自己的電腦能不聽自己的話么.即使不聽,也得教訓(xùn)下,讓它聽話.

其實(shí)上面基本就是核心代碼了,這里需要注意的就是VARIANT 和BSTR類型變量的使用,這個(gè)網(wǎng)上的資料還是很多的,我看網(wǎng)上的資料沒看明白,看msdn明白了.

VARIANT 就是一個(gè)為了實(shí)現(xiàn)語言無關(guān)性,Com接口中的.用的時(shí)候,就是指定下當(dāng)前的數(shù)據(jù)類型,然后往指定的數(shù)據(jù)類型的屬性中賦值就可以了,是一個(gè)封裝了大多數(shù)基本數(shù)據(jù)類型的類.

 

還有一個(gè)難點(diǎn)就是,到了搜索結(jié)果頁,直接用IHTMLLinkElement2 和IHTMLLinkElement都得不到A的鏈接,無奈了,用IHTMElement2 IHTMElement 都可以了的,起初直接用IHTMLLinkElement2強(qiáng)制轉(zhuǎn)換IHTMElement2 ,然后修改鏈接的target(IHTMLLinkElement2才有的)屬性,不行,肯定不行了,向下類的繼承也知道不行的.這折騰了我好長(zhǎng)時(shí)間.就又到msdn看呀看,終于看了到了IHTMLElement 的SetAttribute、RemoveAttribute,頓感救星來了,果然如此,用SetAttribute("target","_self");當(dāng)然里面的字符串要用BSTR了,到此就完成了,中間隔時(shí)間,我全部用SetTimer來完成,下面貼出OnTimer的代碼(我調(diào)試的代碼都在,有的代碼是沒有用的了)

 

代碼
void CTimerSerachDlg::OnTimer(UINT_PTR nIDEvent)
{
    
// TODO: 在此添加消息處理程序代碼和/或調(diào)用默認(rèn)值
    BSTR state = {0};
    
char *pSate=NULL;
    
    
if (nIDEvent==1)
    {
        GetKeyWord();
        HRESULT hr 
= E_FAIL;
        CComPtr
<IDispatch> spDispDoc = m_ie.get_Document();
        CComPtr
<IHTMLDocument2> spHtmlDoc = NULL;
        hr 
= spDispDoc->QueryInterface(IID_IHTMLDocument2,(void **)&spHtmlDoc);
        
if (FAILED(hr) || NULL == spHtmlDoc)
        {
            
//return FALSE;
        }

        spHtmlDoc
->get_readyState(&state); 
        pSate 
= _com_util::ConvertBSTRToString(state);
        
if(strcmp(pSate,"complete")==0//檢測(cè)下狀態(tài)
        {
            
        }
        
else
        {
            
return;
        }
        
//開始解析網(wǎng)頁
        CComPtr<IHTMLWindow2>  pHTMLWnd = NULL;   
        CComPtr
<IHTMLDocument2> pChilDoc = NULL;
        LPDISPATCH   lpDispatch;   

        
        CComPtr
<IHTMLFramesCollection2> pFrames=NULL;
        spHtmlDoc
->get_frames(&pFrames);
        
long frameCount = 0;
        pFrames
->get_length(&frameCount);
        
//獲取第一個(gè)frame
        VARIANT   varindex,varresult;  
        varresult.vt
=VT_DISPATCH;   
        varindex.vt   
=   VT_I4;
        
        varindex.lVal 
= 0;
        hr 
= pFrames->item(&varindex,   &varresult);
        
if (S_OK != hr)
        {
            
return;
        }

        lpDispatch 
= (LPDISPATCH)varresult.ppdispVal;
        
if(SUCCEEDED(lpDispatch->QueryInterface(IID_IHTMLWindow2,   (LPVOID   *)&pHTMLWnd)))   
        {   
             pChilDoc 
= HtmlWindowToHtmlDocument(pHTMLWnd);
             
if (pChilDoc==NULL)
             {
                 
return;
             }
        }
        
else
        {
            
return;
        }
        
        CComPtr
<IHTMLElementCollection> pForms = NULL;
        pChilDoc
->get_forms(&pForms);
        
        
long formCount = 0;
        pForms
->get_length(&formCount);
        CComPtr
<IDispatch> formDis = NULL;
        _variant_t index 
= 0;
        hr 
= pForms->item(index,index,&formDis);
        
        
if (hr!=S_OK)
        {
            
return;
        }
        
//get the form interface
        CComPtr<IHTMLFormElement> pFirstForm = NULL;
        hr 
= formDis->QueryInterface(IID_IHTMLFormElement,(void **)&pFirstForm);
        
if (hr!=S_OK)
        {
            
return;
        }
        formDis.Release();
        BSTR formName 
= {0};
        pFirstForm
->get_name(&formName);
        CComPtr
<IDispatch> inputDis = NULL;
        index 
= 4;
        pFirstForm
->item(index,index,&inputDis);
        CComPtr
<IHTMLInputTextElement> qElem = NULL;
        inputDis
->QueryInterface(IID_IHTMLInputTextElement,(void**)&qElem);
        inputDis.Release();
        BSTR tagName
={0};
        BSTR id
={0};
        qElem
->get_name(&tagName);
        BSTR value 
= {0};
        
        qElem
->put_value(value);
        value
=m_keyWord.AllocSysString();
        qElem
->put_value(value);
        SysFreeString(value); 

        
//成功后,就不用了
        KillTimer(1);
        SetTimer(
2,5000,NULL);//開始單擊按鈕
    }
    
if (nIDEvent==2)
    {
        HRESULT hr 
= E_FAIL;
        CComPtr
<IDispatch> spDispDoc = m_ie.get_Document();
        CComPtr
<IHTMLDocument2> spHtmlDoc = NULL;
        hr 
= spDispDoc->QueryInterface(IID_IHTMLDocument2,(void **)&spHtmlDoc);
        
if (FAILED(hr) || NULL == spHtmlDoc)
        {
            
//return FALSE;
        }

        spHtmlDoc
->get_readyState(&state);
        pSate 
= _com_util::ConvertBSTRToString(state);
        
if(strcmp(pSate,"complete")==0)
        {

        }
        
else
        {
            
return;
        }
        
//開始解析網(wǎng)頁
        CComPtr<IHTMLWindow2>  pHTMLWnd = NULL;   
        CComPtr
<IHTMLDocument2> pChilDoc = NULL;
        LPDISPATCH   lpDispatch;   


        CComPtr
<IHTMLFramesCollection2> pFrames=NULL;
        spHtmlDoc
->get_frames(&pFrames);
        
long frameCount = 0;
        pFrames
->get_length(&frameCount);
        
//獲取第一個(gè)frame
        VARIANT   varindex,varresult;  
        varresult.vt
=VT_DISPATCH;   
        varindex.vt   
=   VT_I4;

        varindex.lVal 
= 0;
        hr 
= pFrames->item(&varindex,   &varresult);
        
if (S_OK != hr)
        {
            
return;
        }

        lpDispatch 
= (LPDISPATCH)varresult.ppdispVal;
        
if(SUCCEEDED(lpDispatch->QueryInterface(IID_IHTMLWindow2,   (LPVOID   *)&pHTMLWnd)))   
        {   
            pChilDoc 
= HtmlWindowToHtmlDocument(pHTMLWnd);
            
if (pChilDoc==NULL)
            {
                
return;
            }
        }
        
else
        {
            
return;
        }

        CComPtr
<IHTMLElementCollection> pForms = NULL;
        pChilDoc
->get_forms(&pForms);

        
long formCount = 0;
        pForms
->get_length(&formCount);
        CComPtr
<IDispatch> formDis = NULL;
        _variant_t index 
= 0;
        hr 
= pForms->item(index,index,&formDis);

        
if (hr!=S_OK)
        {
            
return;
        }
        
//get the form interface
        CComPtr<IHTMLFormElement> pFirstForm = NULL;
        hr 
= formDis->QueryInterface(IID_IHTMLFormElement,(void **)&pFirstForm);
        
if (hr!=S_OK)
        {
            
return;
        }
        formDis.Release();
        BSTR formName 
= {0};
        pFirstForm
->get_name(&formName);
        CComPtr
<IDispatch> inputDis = NULL;
        index 
= 5;
        pFirstForm
->item(index,index,&inputDis);
        CComPtr
<IHTMLElement> qElem = NULL;
        inputDis
->QueryInterface(IID_IHTMLElement,(void**)&qElem);
        inputDis.Release();
        BSTR tagName
={0};
        BSTR id
={0};
        qElem
->get_tagName(&tagName);
        qElem
->get_title(&tagName);
        
/*BSTR value = {0};

        qElem->put_value(value);
        value=m_keyWord.AllocSysString();
        qElem->put_value(value);
        SysFreeString(value); 
*/
        qElem
->click();
        
//成功后,就不用了
        KillTimer(2);
        SetTimer(
3,5000,NULL);//開始單擊搜索結(jié)果
    }
安徽新華電腦學(xué)校專業(yè)職業(yè)規(guī)劃師為你提供更多幫助【在線咨詢
主站蜘蛛池模板: 玖草资源在线 | 午夜精品久久久久久久99热 | 久在线观看视频 | 9 9久热re在线精品视频 | 日韩亚洲精品不卡在线 | 国产精品拍自在线观看 | 国产成人91激情在线播放 | 免费观看一级欧美在线视频 | 日本久久中文字幕 | 九九热这里只有国产精品 | 国产人妖china ts| www.99色.com| 天天弄天天操 | 欧美第九页 | 亚洲国产精品久久人人爱 | 色综合久久中文字幕网 | 久久er99热精品一区二区 | 久久国产精品99国产精 | 欧美性20hd另类 | 免费又黄又猛又爽的大片 | 黄视频日本 | 日本性色 | 久久久久久国产精品mv | 91影视永久福利免费观看 | 国产jizzjizz免费看jizz | xxxx日本免费高清视频 | 欧美成人性色xxxxx视频大 | 人人干在线观看 | 欧美日操 | 日本成人网址 | 波多野结衣免费免费视频一区 | 欧美视频第二页 | 亚洲va中文字幕 | 亚洲日本中文 | 中文字幕一区视频一线 | 久久久精品免费热线观看 | 免费一级做a爰片性色毛片 免费一看一级毛片 | 69日本人| 国产成人福利在线 | 蜜臀一区 | 欧美一级视频在线高清观看 |