文字列から数字だけ抽出「numExtract」の解説

今回は、文字列から数字だけ抽出するサブルーチンを解説していきます。
HTMLソースを操作する中で文字列から数字だけ抽出したいと思うことは多々あります。
そういった場合にこちらのサブルーチンが非常に役立ちます。
例えば、競合サイトの金額のチェックをしたいと考え競合サイトから情報を収集する際に、以下のようなHTMLのソースだった場合どのように金額だけ抽出しますか?

<p>4,521円</p>

一番手っ取り早いのは、pタグをinnerTextプロパティでテキストを抽出させた後に、抽出した列全体に置換で「円」を削除する方法です。

他にもRightやLen関数を利用して「円」を削除する方法があります。
では以下の場合どうでしょうか?

<p>A商品の価格は4,521円</p>
<p>B商品の価格は214,521円</p>

文章の文言も違えば金額の桁数も違います。
このようなことは多々あるので、そういったときに文字列から数字だけ抽出するサブルーチンを作成しておけば、非常に簡単に数字だけ抽出することができます。

スポンサー リンク

文字列から数字だけ抽出するサブルーチン


Function numExtract(strValue As String) As String

 Dim i As Integer

 For i = 1 To Len(strValue)

  oneTxt = Mid(strValue, i, 1)
    
  If oneTxt Like "[0-9]" Then: numExtract = numExtract & oneTxt

 Next i

End Function

※ドラッグ(スワイプ)すると全体を確認できます。

文字列から数字だけ抽出するマクロ

Sub sample()
     
 'テストページをIEで表示
 Call ieView(objIE, "http://www.vba-ie.net/code/test4.html")
    
 For Each objTag In objIE.document.getElementsByTagName("p")
                                                             
  If InStr(objTag.outerHTML, "円") > 0 Then

   Debug.Print numExtract(objTag.innerHTML)
            
  End If
        
 Next

End Sub

※ドラッグ(スワイプ)すると全体を確認できます。

実行結果

4521
214521

今回は、値を取得するために戻り値が必要となりますのでfunctionマクロで対応しています。
引数は以下の1つが設定されています。

引数名データ型内容値の事例初期値省略
strValueStringチェックする文字列"A商品の価格は4,521円"×
numExtract("チェックする文字列")

「strValue」は必須項目です。
数字だけを抽出する対象の文字列を指定してください。
それでは、1つずつコードを見ていきましょう。


For i = 1 To Len(strValue)
(省略)
Next i

※ドラッグ(スワイプ)すると全体を確認できます。

文字列のチェックは1文字ずつチェックしていきます。
ここでは、「For~Nextステートメント」で対象の文字列の文字数分だけチェックしています。


oneTxt = Mid(strValue, i, 1)

※ドラッグ(スワイプ)すると全体を確認できます。

こちらでは、Mid関数を利用して、文字を1文字抽出しています。


If oneTxt Like "[0-9]" Then: numExtract = numExtract & oneTxt

※ドラッグ(スワイプ)すると全体を確認できます。

そして、正規表現[0-9]を用いて対象の1文字が数字かどうかチェックしています。
数字の場合は、numExtract変数に結合させ、数字の集合体を形成していきます。
こちらをループ処理で行うことで、数字だけ抽出されます。
尚、こちらの「IF~Thenステートメント」は省略形で記述されていますので、ご注意ください。

また、こちらは1つだけ欠点があります。
以下の場合どのようになるでしょうか?

<p>商品1の価格は4,521円</p>
<p>商品2の価格は214,521円</p>

結果は以下のようになり正しい金額を抽出できません。

実行結果

14521
2214521

このように欠点を理解した上で、利用していけば対応策はいくらでもあるので、何でもかんでもサブルーチンに頼らず臨機応変に対応してください。

次の記事: VBAでIE操作に役立つ正規表現でデータを抽出 >>

Excel VBAでIEを思いのままに操作できるプログラミング術 Excel 2013/2010/2007/2003対応

近田 伸矢, 植木 悠二, 上田 寛

IEのデータ収集&自動操作のプログラミング本はこの1冊だけ!IEの起動やポップアップウィンドウ、表示を制御する基本的なコードはもちろん、テキストボックスやラジオボタン、表、ハイパーリンクなどのHTML部品を制御する方法など、自動操作に欠かせないノウハウを丁寧に解説。

VBAのIE制御についてのQ&A掲示板

↑VBAのIE操作で分からない事があればこちらの掲示板よりご質問ください。

ExcelのVBA初心者入門

↑こちらはVBAをマスターできるよう初心者向けのエクセルVBA入門コンテンツになります。

目次

IE操作に便利なツール

こちらでは、これまでに紹介したIE(InternetExplorer)操作で便利な機能をツール化しています。無償でダウンロードできますので、目的に合わせたご利用ください。

IEのメソッド・プロパティ

こちらでは、IE(InternetExplorer)オブジェクトのメソッド・プロパティをまとめています。

IE操作のVBA関数

こちらでは、エクセルVBAのIE(InternetExplorer)操作で利用されたVBA関数をまとめています。

IE操作のステートメント

こちらでは、エクセルVBAのIE(InternetExplorer)操作で利用されたステートメントをまとめています。ExcelのVBAで基本的な部分になりますので、しっかり理解しましょう。

IE制御のVBAコード

こちらでは、これまでに作成したIE(InternetExplorer)操作で役立つサブルーチンをまとめています。
全てをコピーする必要はありませんが、目的に合わせたサブルーチンをご利用ください。

役立つVBAコード

こちらでは、IE(InternetExplorer)制御の利用だけでなく、Excel全般で利用できるVBAコードです。エクセルVBAで役に立つものばかりですので、ご利用ください。