タイトル : Re^5: Webbrowser.DocumentからHTMLでタグのないテキストを取得したい 投稿日 : 2005/10/19(Wed) 23:36 投稿者 : YAS
[OSのVer]:Windows [VBのVer]:VB.NET 魔界の仮面弁士さんのヒントからMSHTMLをさらに調べ,以下のコードで 希望の結果を得ることができました!! (プロジェクトにMSHTMLオブジェクトライブラリの参照を追加する) Imports MSHTML Public Class Form1 Dim Idt As Integer Private Sub Form1_Load(ByVal sender As Object, ByVal e As System.EventArgs) _ Handles Me.Load Me.WebBrowser1.Navigate(Application.StartupPath & "\test.html") End Sub Private Sub WebBrowser1_DocumentCompleted(ByVal sender As Object, _ ByVal e As System.Windows.Forms.WebBrowserDocumentCompletedEventArgs) _ Handles WebBrowser1.DocumentCompleted Dim myDoc As HTMLDocument = Me.WebBrowser1.Document.DomDocument PrintNodeTree(myDoc.body) myDoc.close() End Sub Private Sub PrintNodeTree(ByVal Node As IHTMLDOMNode) For Each cNode As IHTMLDOMNode In Node.childNodes Debug.Print(Space(Idt) & "<" & cNode.nodeName & ">") If Not cNode.nodeValue Is DBNull.Value Then Debug.Print(Space(Idt) & cNode.nodeValue) End If If cNode.hasChildNodes Then Idt += 4 PrintNodeTree(cNode) End If Next Idt -= 4 End Sub End Class ご助言いただいたみなさんのおかげで(たぶん)解決いたしました。 ありがとうございました!! P.S.コードに(開放忘れ等の)間違いや,よりシンプルに書ける部分がありましたら 引き続きご教授お願いいたします! |