By 肥貓, 18 九月, 2025 @ 肥貓的異想世界 試用Python製作一支簡單的爬蟲程式 讀法規考古題,不外乎是要記法條。但是一條一條從全國法規資料庫慢慢複製貼上會很繁瑣。最便捷的方式無非是寫支爬蟲,逐條寫進檔案(本例是csv)。但是請留意,爬蟲請避免用在有著作權或流量限制的網站上以免觸法。在合理使用的前提下,使用政府的開放資料還是比較妥當。以我國刑法為例,進入全國法規資料庫刑法的網頁後,在條文處按右鍵->檢測,我們要看這html文件的階層分佈。知道他的物件Class為"col-no";同樣看到內文的物件Class為"law-article"
By 肥貓, 18 九月, 2025 @ 肥貓的異想世界 試用Python製作一支簡單的考試程式 網路上常見如阿摩、MOSME等線上題庫,讓使用者在上面做考古題、做完對答案...諸如此類。但是這種網站畢竟是套裝軟體,若想自己修改參數,例如題目考啥、考幾題、答對得幾分、答錯倒扣幾分、甚至答題紀錄等不甚方便。有時還需要付錢+登入才能使用。最近肥貓在準備轉職的考試,想說這些功能如果網站沒有,自己弄一個不就得了嗎?於是用Python做出一支簡單的考試程式來用。題庫建立為避免版權爭議,我就不提供原始的題庫,就隨便出幾題來demo。
By 肥貓, 27 五月, 2025 @ 肥貓的異想世界 簡單處理在Ubuntu終端機啟動Miniconda的問題 Miniconda是開發者常用的一種套件,這裡就不贅述他的功能。不過,若不想他在非工作時段跑出來佔您的終端機的效能,您可以在安裝的時候預設不讓它啟動(節錄如下圖)但問題來了,如果您回來開發時想啟動它,他的說明就沒那麼好讀(節錄如下圖)。
By 肥貓, 18 三月, 2025 @ 肥貓的異想世界 在LibreOffice Calc利用Vlookup做精準搜尋 有在Microsoft Excel用過VLOOKUP的人知道,最後一個參數選False的時候,是做精準搜尋。但是在LibreOffice Calc,則是截然不同的功能。若要在Calc做精準搜尋,則可在最後一個參數使用「0」(如圖),系統就會認定要做精確比對。這是Franklin教我的,但是中文找不太到合適的說明。故寫在這裡供周知。
By 肥貓, 3 十一月, 2023 @ 肥貓的異想世界 用QGIS + OpenStreetMap + Python 處理線形地理資料 本文內容是敘述如何用QGIS,結合開放街圖(OpenStreetMap)的圖資,以及Python資料處理,在QGIS上處理資料。本次使用圖資:福爾摩沙高速公路(即我國國道三號,下稱福高)的路線圖。取得圖資(XML):去OpenStreetMap尋找福高路線圖的XML檔。搜尋「福爾摩沙高速公路(北上)」,取得該路線圖編號(3876887)。並於畫面下方點選「下載XML」,進入XML顯示頁面。操作過程如下三張圖所示
By 肥貓, 24 七月, 2023 @ 肥貓的異想世界 試解決Zotero安裝後無法使用LibreOffice Integration引用文獻的問題 寫論文必會遇到引用文獻的問題,一般大專院校都是使用EndNote的軟體;但是EndNote只支援Windows和Mac,而且單價不斐。在Linux上我則是使用Zotero作為上述的替代品。 在Ubuntu 18.04使用Zotero,沒遇到太多問題。但是進入20.04和22.04後,則接連發生LibreOffice抓不到Zotero LibreOffice Integration的致命問題。通常成因,是電腦沒有安裝合適的JRE(Java Runtime Enviroment)導致。 此時建議從兩方向著手: 安裝合適的JAVA套件 處理的方法也很簡單,請直接在終端機以apt 指令安裝: sudo apt install libreoffice-java-common 這樣就可以了。使用其他的JAVA套件不敢說不對,但在LibreOffice的環境可能無法對症下藥。 安裝合適的JDK套件 用終端機以apt指令找,會發現OpenJDK有多個版本。我是直接安裝最新版,也沒想太多: openjdk-17-jre
By 肥貓, 29 四月, 2023 @ 肥貓的異想世界 肥貓的開源統計語言的書目資料庫 近日和教授討論到統計軟體學習的問題(某種程度上我不是靠學術本科吃飯,反而越來越靠統計學和寫程式吃飯了)。免不了討論業界兩大開源殺手級語言,即Python和R,鑑於這幾年Python崛起,所以我也慫恿教授的統計學課程應該來多玩玩Python。 不過,我深知研究生看書的痛苦。所以我整理了一份中難度的書單,幫助同學精準對上課程內容。只討論基礎統計學,特別是單變量統計的書就比較少列了,這種書自己找就有。這裡列的主要是社會科學或商務的多變量統計,舉凡迴歸分析(含對數勝算模型Logit Model)、因素分析、集群分析等。這種書雖然很多,但是有時牽涉太多程式設計的內容,對於專門做統計的課程反而失焦,且徒增學生負擔而必須篩選。 這也意味著讀者必須適時做一些篩選,學習只挑著看需要的章節。就算三天三夜不睡覺,您是不太可能18週內把他們全部看完的。
By 肥貓, 25 四月, 2023 @ 肥貓的異想世界 嘗試讓物件導向更通俗的詮釋法 之前受訓的末期,講師淺談了(Python)程式設計的物件導向。物件導向是在業界打滾的重要知識,不過對於新手來說技術門檻稍高。加上考證照、做期末專題等瑣事影響注意力,老師講得口沫橫飛,台下同學(如我)卻睡成一片。 結訓後我複習兼思考+檢討後,我想到一個似乎比較好理解,但是我不知道別人是否也很好理解的教法。但就姑且寫下來吧。 以一杯市售紅茶為例 假設您的桌上有杯A牌子的市售紅茶。看到他的營養標示這樣寫的(每100毫升)(不過這裡簡單起見,就沒做單位標示): 熱量:26.7大卡 蛋白質:0.2公克 脂肪:0公克 碳水化合物:6.6公克 鈉:2.8毫克 初學者鍵入Python的作法,通常就是為這些東西分別設定變數,如(下圖上半部): black_tea_A_calories=26.7 black_tea_A_protein=0.2 black_tea_A_fat=0 black_tea_A_carbonhydrate=6.6 black_tea_A_na=2.8
By 肥貓, 9 三月, 2023 @ 肥貓的異想世界 簡單解決LibreOffice多階層編號跑掉的問題 近來應論文老闆邀請,鞭屍我的碩士論文來投稿研討會(今年TASPAA在本系舉辦,我的老闆可說是如臨大敵)。研討會文章要做多階層編號,若只是套範本來修,似乎沒什麼問題(以下畫面都是改寫中的初稿)。但是當我弄到階層三(標題3)的時候(如下圖紅框處),咦怎麼編號不見了? 但是如果你用老方法,去工作列的「切換編號清單(或按F12)」找,會發現他的編號是沒套用到你原本的樣式的,你硬設會弄得更糟,嚴重的話會把下面階層的東西都毀掉。 (正常的設定值應該要長得像下圖) (但是你在標題3按了切換編號清單設定卻變成這樣!?)
By 肥貓, 3 三月, 2023 @ 肥貓的異想世界 憶Michael 我第一次遇到Michael是2018年的ezgo分享會,我去分享會的主要原因是處理當時我的LibreOffice調查問卷的一些事情,去拜會與感謝當時協助發問卷的Franklin,然後也認識了當時查資料常看到的Eric教宗等等,剛好Michael是下午場的一個講者,席間聽到他工商服務了A+A Space這個軟體自由反抗軍的根據地(之一),心想既然入了自由軟體的坑,當然要直搗黃龍囉。所以隔天就亂入了A+A Space(當時在南京復興站附近)的不公開會議,從此意外地成為了當地的超級屁貓。