分類： Windows

Excel WEBSERVICE 與 FILTERXML 函數自動下載網頁資料，網路爬蟲程式教學

這裡示範如何使用 Excel 的 WEBSERVICE 自動下載網路上的資料，並藉由 FILTERXML 函數萃取出有用的資訊，即時顯示於 Excel 表格內。

許多人應該都聽過網路爬蟲程式，它可以自動下載網路上的資料，並萃取出有用的資訊，幫使用者省下手動抓資料的時間，而在 Excel 中其實也有內建類似的功能，只不過使用上需要一些技巧，以下是在 Excel 中開發爬蟲程式的簡單教學。

`WEBSERVICE` 下載網頁函數

在 Excel 中如果想要把網路上及時的資料下載下來，放進 Excel 的報表中，可以使用 WEBSERVICE 這個網路服務函數，它可以接受任何的 URL 網址，自動將網頁內容擷取下來：

=WEBSERVICE(網址)

例如在行政院環境保護署環境資源資料開放平臺上面，可以查到即時的紫外線觀測資料，XML 格式的資料會類似這樣：

紫外線觀測資料 XML 檔

若要在 Excel 中把這個即時的紫外線觀測資料抓下來，就把 XML 檔的網址放進 WEBSERVICE 函數中即可：

=WEBSERVICE("http://opendata2.epa.gov.tw/UV/UV.xml")

以 WEBSERVICE 函數抓取資料

不過由於大部分的網路資料 API 所提供的資料都是 XML、CSV 或 JSON 這類的編碼格式，所以若使用 WEBSERVICE 抓下來之後，直接放在 Excel 表格中，就會像這樣不太好閱讀，若想要產生比較乾淨的報表，就需要再加上一些處理。

`FILTERXML` 解析 XML 函數

Excel 的 FILTERXML 函數可用來解析複雜的 XML 結構資料，快速從大量的 XML 資料中取出有用的資訊，有了這個函數我們就可以在不需要自己寫 VBA 程式的情況下，解析各種 XML 資料，其用法如下：

=FILTERXML(XML資料,XPath路徑)

通常 XML 資料的部分就直接放置 WEBSERVICE 抓回來的結果，然後再使用 XPath 路徑指定要萃取的資訊。

以上面的紫外線觀測資料範例來說，我們可以使用 /UV/Data[1]/County 這個 XPath 把 XML 中第一筆資料的縣市名稱抓出來：

=FILTERXML(WEBSERVICE("http://opendata2.epa.gov.tw/UV/UV.xml"),"/UV/Data[1]/County")

接著再用 /UV/Data[1]/UVI 這個 XPath 抓出紫外線指數：

=FILTERXML(WEBSERVICE("http://opendata2.epa.gov.tw/UV/UV.xml"),"/UV/Data[1]/UVI")

這樣就可以非常精準的把有興趣的資訊抓出來，放在 Excel 表格中了：

解析 XML 資料結果

由於在 Excel 中現成可用的解析工具只有適用於 XML 檔的 FILTERXML 函數，若遇到 JSON 或 CSV 檔的話，就真的要寫 VBA 程式了，所以如果自己要下載的資料有 XML 格式可用的話，就盡量選擇 XML 格式，會方便許多。

參考資料：analystcave.com

G. T. Wang

個人使用 Linux 經驗長達十餘年，樂於分享各種自由軟體技術與實作文章。

下一篇 Python 使用 requests 模組產生 HTTP 請求，下載網頁資料教學 »

上一篇 « Excel LOOKUP 函數教學：查詢表格，找出對應資料

Published by

G. T. Wang

標籤： ExcelOffice網路

8 年 ago

Windows 設定 PuTTY 以 Yubico Security Key 實體金鑰遠端登入 SSH 伺服器教學
本篇介紹如何在 Windows...
網路安裝正版 Office 家用版 2019 步驟教學
本篇介紹如何在購買 Offic...
[開箱] Office 家用版 2019 正版盒裝序號
本篇是正版盒裝 Office ...

[開箱] 購買 Steam 火影忍者遊戲與副廠 Xbox 手把記錄

本篇記錄我在 Steam 遊戲...

2 年 ago

生活

光陽 KYMCO GP 125 機車接電發動、更換電瓶記錄

本篇記錄我的光陽 KYMCO ...

3 年 ago

開箱

Excel WEBSERVICE 與 FILTERXML 函數自動下載網頁資料，網路爬蟲程式教學

`WEBSERVICE` 下載網頁函數

`FILTERXML` 解析 XML 函數

Recent Posts

[開箱] 購買 Steam 火影忍者遊戲與副廠 Xbox 手把記錄

光陽 KYMCO GP 125 機車接電發動、更換電瓶記錄

[開箱] YubiKey 5C NFC 實體金鑰

Windows 設定 PuTTY 以 Yubico Security Key 實體金鑰遠端登入 SSH 伺服器教學

macOS 設定 Yubico FIDO U2F Security Key 實體金鑰認證遠端登入 SSH 伺服器教學

[DIY] 自製竹火把

Excel WEBSERVICE 與 FILTERXML 函數自動下載網頁資料，網路爬蟲程式教學

WEBSERVICE 下載網頁函數

FILTERXML 解析 XML 函數

相關文章

Recent Posts

[開箱] 購買 Steam 火影忍者遊戲與副廠 Xbox 手把記錄

光陽 KYMCO GP 125 機車接電發動、更換電瓶記錄

[開箱] YubiKey 5C NFC 實體金鑰

Windows 設定 PuTTY 以 Yubico Security Key 實體金鑰遠端登入 SSH 伺服器教學

macOS 設定 Yubico FIDO U2F Security Key 實體金鑰認證遠端登入 SSH 伺服器教學

[DIY] 自製竹火把

`WEBSERVICE` 下載網頁函數

`FILTERXML` 解析 XML 函數