「ESG檢測儀:我們與永續轉型的距離」是綠色公民行動聯盟透明足跡小組於2021年啟動的專案,透過更詳盡的ESG開放資料,確實掌握企業在永續轉型的努力,促進企業邁向環境永續的「正向競逐」。
關於各工作項目的開發說明,詳見相應目錄的說明文檔:
- 資料爬蟲:
crawler
- 網站:
esg-ui
ESG檢測儀:我們與永續轉型的距離-綠色公民行動聯盟透明足跡專案,透過更詳盡的ESG開放資料,確實掌握企業在永續轉型的努力,促進企業邁向環境永續的「正向競逐」。
Home Page: https://thaubing-esg.gcaa.org.tw/
License: Other
圖表呈現碳排放變化量 + 一切照舊預測趨勢
呈現資訊為加總該產業別所有公司碳排放後的結果(單位為產業)
使用資料:溫室氣體年排放量_計算
Update LICENSE according to team's decision made on Aug 27, 2021:
Meeting minutes: 2021年8月27日_指標討論會_會議紀錄 (google doc)
重要會計科目:
total_operating_revenue
total_operating_costs
total_operating_expenses
net_operating_income
profit_or_loss
total_comprehensive_income
total_assets
ESG檢測儀的手機版
點進去預設是石化業
改變業別之後頁面會沒辦法上下滑動要重新整理才能滑
試了三隻手機都是這樣
本處統整工作項目清單,細節另外開至其他issue中
完成資料庫建置,工作包括:
資料儲存方法待討論決定:
SQL (Postgres)
打公司名、簡稱,跨產業別找東西
拖了很久,終於把資料整理好了。
這次的資料表將環境、社會、治理分成三張表,之後也會把其他業別既有的資料也調整成這份的格式。
之後也會把工作表的名稱統一為以下
CSR報告書資料清單-西元年(報告年度)_產業別代碼_產業別名稱
整理後會變成每個年度、每個產業都是獨立的資料表,不知道對於ddio這邊工作會不會造成很大影響?
再麻煩ddio協助調整匯入的程式碼。
資料集:這邊
也許可以在這邊討論一下資料表的格式?
補上 #2 公司基本資料「產業別」欄位的代碼,所對應的產業別名稱
上市公司產業類別 | 上櫃公司產業類別 | 新編碼 (31類) |
---|---|---|
水泥工業 | -- | 01 |
食品工業 | 食品工業 | 02 |
塑膠工業 | 塑膠工業 | 03 |
紡織纖維 | 紡織纖維 | 04 |
電機機械 | 電機機械 | 05 |
電器電纜 | 電器電纜 | 06 |
化學工業 | 化學工業 | 21 |
生技醫療業 | 生技醫療業 | 22 |
玻璃陶瓷 | 玻璃陶瓷 | 08 |
造紙工業 | -- | 09 |
鋼鐵工業 | 鋼鐵工業 | 10 |
橡膠工業 | 橡膠工業 | 11 |
汽車工業 | -- | 12 |
半導體業 | 半導體業 | 24 |
電腦及週邊設備業 | 電腦及週邊設備業 | 25 |
光電業 | 光電業 | 26 |
通信網路業 | 通信網路業 | 27 |
電子零組件業 | 電子零組件業 | 28 |
電子通路業 | 電子通路業 | 29 |
資訊服務業 | 資訊服務業 | 30 |
其他電子業 | 其他電子業 | 31 |
建材營造 | 建材營造 | 14 |
航運業 | 航運業 | 15 |
觀光事業 | 觀光事業 | 16 |
金融保險 | 金融業 | 17 |
貿易百貨 | 貿易百貨 | 18 |
油電燃氣業 | 油電燃氣業 | 23 |
綜合 | -- | 19 |
其他 | 其他 | 20 |
-- | 文化創意業 | 32 |
-- | 農業科技業 | 33 |
-- | 電子商務 | 34 |
-- | 管理股票 | 80 |
公開資訊觀測站/非擔任主管職務之全時員工薪資資訊
https://mops.twse.com.tw/mops/web/t100sb15
圖表呈現碳排放變化量 + 一切照舊預測趨勢
依產業別顯示
使用資料:溫室氣體年排放量_計算
串接方式:環保署API,需有金鑰。可依特定欄位排序,每次存取筆數1,000筆。
檔案格式:JSON/CSV
列管事業單位的基本資料(管制編號、名稱、地址等),主要從「環境保護許可管理系統(暨解除列管)對象基本資料」資料集取得,但該資料集目前只有整合空水廢毒污染源列管對象,尚未包含溫室氣體排放的列管事業單位。詳細請見該資料集在政府資料開放平台上,下方提問區環保署的回覆:
Re: 相關資料集之列管污染源管制編號未列於本資料集?
感謝您關心環保事務,有關您詢問環境保護許可管理系統(暨解除列管)對象基本資料內容,經洽相關單位說明如下:
因「環境保護許可管理系統(暨解除列管)對象基本資料」現僅提供空水廢毒污染源列管資料,該資料集目前並無納入「溫室氣體年排放量」列管事業資訊,故部分公司資料並未收錄。
以上說明,環保署關心您~
JavaScript
圖表呈現碳排放變化量 + 一切照舊預測趨勢 + 企業自訂減量目標
呈現資訊為單一家公司碳排放的變化與預測
使用資料:溫室氣體年排放量_計算
資料說明:環保署整理前年民眾陳情資訊,彙整於地圖資料後公開。
串接方式:環保署資料平台網址下載
檔案格式:ZIP/geoJSON
整理方式:將座標點放上地圖呈現(須包含細節說明資訊)
昨天跟綠盟討論後,希望可以在現有的各產業頁面上放上同一產業中各公司的表現比較圖,有幾點想跟Kelvin和ddio討論和請兩位幫忙:
目前初步挑選碳密集度跟能源密集度兩項指標做圖。
見下方附圖(以石化業-碳密集度為例):
cc @qyke
延續 #12 爬蟲所得的公司合併財務報表網頁(資料另存放在 thaubing-esg-raw-data),擷取其中以下表格資料:
...以及公開資訊觀測站上的:
待確認:是否需要存用備註?
資料說明:該資料庫彙整各公司CSR報告書,並將之文字化,因此可透過資料庫搜尋找到各公司在減碳上的揭露狀況以及自主承諾內容。
處理方式:需有明確關鍵字進行搜尋,再將純文字內容透過爬蟲取得,經適當排版來做呈現。
資料格式:分成原始PDF檔、永訊提取後的純文字內容
關鍵字搜尋機制仍待測試
須測試爬蟲可行性
bug
修正有實際資料時,tooltip 的用字建立滿足網站資訊架構的 ETL ,維持網站效能在可接受的程度內
在裁罰部分,我們把實際造成污染的空氣、水的相關法規抓出來,這個部分要麻煩以文字內容是否包含來做判斷
要調整的呈現是個別公司的頁面,在違反環境法規的長條圖,變成堆疊長條圖,從上到下分別是
詳見指標文件
資料來源:財政部/全國營業(稅籍)登記資料集 https://data.gov.tw/dataset/9400
營業地址/統一編號/總機構統一編號/營業人名稱/
資本額/設立日期/組織別名稱/使用統一發票/
行業代號/名稱/行業代號1/名稱1/行業代號2/名稱2/行業代號3/名稱3
使用者來信,
日前我們在參照ESG檢測儀的數據時,發現許多企業於2017年的「直接+間接排放」欄位的排放數據(從左邊數過來第三欄),明顯偏離五年來的趨勢。下表是我從ESG檢測儀整理的國內主要溫室氣體排放企業的數據:
以中鋼為例,其GHG在2016年的排放量達八位數(22,337,642.14)Co2e,2017掉到六位數,到2018年又回到了八位數。台積電的數據也是在2017年銳減,並不符合逐年成長的趨勢。下圖是我把2017年的資訊,單獨抽換成溫室氣體申報平台(排放量單筆查詢後加總)的數據,就比較符合各企業五年來的變動趨勢了:
自此,敬請貴聯盟抽空確認,ESG檢測儀中,每間企業2017年「直接+間接排放」欄位的數字(從左邊數過來第三欄),有沒有錯置、誤植的可能性。
無
無
麻煩ddio再確認一下數據抓取時,是不是有抓錯格或者加總錯誤。
資料來源:https://data.gcis.nat.gov.tw/od/datacategory;jsessionid=45ABE71DAB6FBDCCA9DC04C8E038010C#sortCount2
資料來源:https://data.gov.tw/dataset/9400
year | stock_code | name | name_abbr | tax_code | industry_code | company_type | industry |
---|---|---|---|---|---|---|---|
2020 | 1301 | 台灣塑膠工業股份有限公司 | 台塑 | 75708007 | 3 | 上市公司 | 塑膠工業 |
目前資料爬蟲的公司清單,僅包含上市、上櫃、公開發行的公司,資料來源是金管會:
thaubing-esg/crawler/thaubing_esg/spiders/company.py
Lines 5 to 11 in 47e8a11
前端網站使用的公司清單則是以 「公司登記資料-C製造業」 「全國營業(稅籍)登記資料集」為基礎,資料來源是 經濟部商業司 財政部
再麻煩ddio開區塊文件給綠盟做填寫
將溫室氣體資料整理計算
資料集:溫室氣體年排放量
僅會保留102年後的資料
若2019為空值,則不呈現於前台
若2017或2020有缺值,則區段往前位移為2016~2019
呈現時,須將淨零路徑做成區域圖放在底部
延續使用 #2 所準備的公司基本資料,由其中的證券代號/公司代碼(stock_code
) ,於公開資訊觀測站爬取近五年(2016 - 2020)12月的董監事持股明細資料:
https://mops.twse.com.tw/mops/web/stapap1
下為資料表格範例(1101 台泥,109年度):
JavaScript
目前看到的是這幾個項目需要修正,再麻煩你了~
確認各金融商品的成立年度,調整產業比較與所屬金融商品對照圖
例如:元大ETF基金成立於2019年,先前的年度應不顯示(?
詳見2021年8月27日_指標討論會_會議紀錄 (google doc)
各項指標後方[]
內列的是資料來源或說明;關於各指標的具體工作項目另列為 Issue,見 #1
在透明足跡-【ESG檢測儀】中,本公司的溫室氣體排放量誤植,2020年本公司為4,056.327噸CO2e,(肆仟零伍拾陸點參貳柒);
貴網誤將4056.327的”,”及”.”均視為”,”,造成排放量變成4百多萬噸。
惠請協助更正,以免造成誤會與誤導。
無
已更新原始大表
資訊修正如下
2401 凌陽科技股份有限公司 範疇二(值) 4,056.327
看了各產業的狀況之後,主要有幾個問題要修。
項目有點多,我依照調整的優先順位來寫。
有問題可隨時討論~
如果有需要Kelvin協助畫圖的,我這邊再跟他說
圖表呈現碳排放變化量 + 企業自訂減量目標
依產業別顯示
使用資料:溫室氣體年排放量_計算
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.