By 肥貓, 12 八月, 2022 @ 肥貓的異想世界 解決操作Spyder在變數欄無法正常顯示變數的問題 前言 由於業界對於Python的接受度較高,碩士論文寫完後,一直有將學習R的經驗移植到Python的想法。只是服役的地方不能用個人電腦,只有放假才能回家上機也讓效果不彰,加上其他原因,只好留待退伍之後再來做。 我對資料分析的概念,一開始是在R和SPSS上建立的。直到服役期間因為業務需接觸Excel,參考相關工具書之後,才重新(也才知道之前繞了不少冤枉路)建構了資料分析的重要概念,雖然這還沒讓我能活用DBMS。
By 肥貓, 23 七月, 2022 @ 肥貓的異想世界 利用LibreOffice/國發會ODF文件應用工具製作信紙標籤 這陣子在某行政機關服替代役,工作內容為文書助勤兼打雜,常要幫長官寄信。由於絕大多數的信件都是寄到幾個特定的機關去,若每個信封都要手寫太浪費時間。在鄰座學長的提議下研發出一套列印信紙標籤的方法。退役前承辦的學長還說,拜託離開前教我一下,不然你印的幾百份我一個月就用完了。所以就用休假時間寫了這篇: 雖然更多人慣用的是Microsoft Word,不過因為我家裡電腦只有LibreOffice Writer,加上如果你的電腦沒有Microsoft Office的時候,工作還是要做啊。所以我接下來的教學還是以LibreOffice的操作為主。若你的電腦安裝的是國發會的ODF文件應用工具,操作方式和LibreOffice一模一樣。但是如果你熟悉作法與原理,應該可以在Microsoft Word上變出一樣的東西,反之亦然。
By 肥貓, 4 八月, 2021 @ 肥貓的異想世界 用R做簡單(但實用)的資料整併 近期需要從較老舊的圖書館系統匯出想借閱的書目列表,資料結構大概長這樣: ________________________________________ 裝訂及其他區別字樣:平裝 發行性質/價格:新臺幣780元 一般性資料:20160111d2015 k y0chiy09 e 正文語文:chi ...... _________________________________________ 但是上面那樣顯然不是適合人閱讀的報表,也不利後續利用。因此需要整理成如下圖的樣式:
By 肥貓, 14 七月, 2021 @ 肥貓的異想世界 試解決Professional FTP(Pro FTPD)佈署時的常見問題 這幾天嘗試在家嘗試架設臨時性的FTP,方便區網內兩台電腦互傳檔案之用。雖然李博明老師寫的Pro FTP(容許匿名登入)的架設說明淺顯易懂,實際操作卻踢到鐵板。可能的原因是文章過舊而與現況不符;也可能是因為我是在Ubuntu上操作,而與原文使用的Debian仍有相當差距。總之我寫這篇的目的不是戰李老師,而是希望補充一些細節或解答,讓後進能少走些冤枉路。 該鐵板簡稱530 Error(或登入不正確),至少在FileZilla用localhost測試看到是這樣。該代號簡單說就是密碼錯誤,但是既然是匿名登入,那還需要什麼密碼?爬了許多文還是解決不了,只好請教協會聊天室裡的先進。得到的解法整理如下: 建議改裝proftpd套件 李老師的演示是安裝proftpd-basic套件。不過個人實測後,建議改裝(功能似乎也比較完整的)proftpd套件,因為系統設定後者套件時,會自動加入一些運作必須的資料夾和設定,可以減少許多後續設定的麻煩。
By 肥貓, 4 七月, 2021 @ 肥貓的異想世界 用R處理字串的簡單示範 因為我喜歡將從開放式課程網頁下載得到的影片檔轉換成音檔,存入手機等方便隨身攜帶與收聽,便衍生出使用命令列(本例為ffmpeg)批次處理的需求。一種方法是用WinFF來代勞,但是若有客製化需求的時候,直接打命令列還是比較乾脆。但是我當然不想傻傻地一個一個檔案慢慢key,便需要利用R的字串處理工具,把變數(如檔案路徑與名稱)和命令式整合在一起。以下示範相關過程與程式碼。 前處理:設定變數與欄位 第一步是先設定變數與欄位,所以我先在Calc做了兩欄,一欄是來源檔的檔名和路徑(在Ubuntu,你可以透過複製該檔,在Calc直接以純文字貼上該檔案路徑);另一欄則是你想要的格式,如果你想做得細一點,也可以再新增一欄鍵入各種參數。 由於R的匯入資料功能使用xls檔比較方便,所以我最後是將其存成xls檔,而非開放格式的ods或csv等格式。
By 肥貓, 10 五月, 2021 @ 肥貓的異想世界 試解決LibreOffice Writer圖表標號數字(小寫)與章節標號數字(大寫)不一致的問題 近日論文口試通過,再經過幾次大修就要送印、送圖書館準備畢業。重頭戲是把之前沒時間顧慮的一些內文用語、排版問題等弄好,畢竟論文是拿來給後人鞭屍的,許多事情可馬虎不得。 不過肥貓這下踢到第一塊鐵板,因為中文學位論文的章節編排是第一章、第一節...一字排開,若在圖表標號時,直接套按章的層級去編號的話,就會發生如圖中啼笑皆非的後果。 但是如果改第一章、第一節的編號,變成小寫數字1,就會變成另一邊有麻煩的問題了;可說是順了姑意逆了嫂意。有些人是索性不理格式規範,直接還是用圖1...圖15的編排去做,反正如果指導教授沒說什麼,圖書館大概也不會刁難。但是如果你是很龜毛的人,那該怎麼辦呢? 之前有問過其他講師,用的方法不外乎要改多層次清單。我知道Word上很多人這樣用,可是這樣不但操作複雜,而且沒弄好可能還會破壞編碼結構,我的文件就被自己搞壞好幾次,只好回溯前一版。我們不管怎麼做,其實都是用假的變數欺騙系統,叫他採用我們要的變數而已,但是如果「騙得」不夠有邏輯、高明,很容易編碼簿就亂掉釀成更大災難。
By 肥貓, 8 五月, 2021 @ 肥貓的異想世界 R語言用於基礎敘述統計的示範 最近因為支援會議所需,被委託處理與會者的資料。雖然都是敘述統計,但是現有的商業軟體難以滿足兼顧效率與經濟的需求。 Excel製作次數分配表(Frequency)的步驟很繁瑣,我看過有人用樞紐分析表做,但看了眼花撩亂。 即使製成表之後,Excel用滑鼠點放製作圓餅圖、直條圖的方式也非常繁瑣,實在難以勝任同時要處理數十張圖的任務。
By 肥貓, 19 二月, 2021 @ 肥貓的異想世界 歷屆多變量課程相關檔案釋出 2019年在政大修了蕭乃沂老師的多變量課程,照往例課程要求除了要用SPSS跑出結果之外,還要用R再做一次。平心而論,R是一個在業界效能絲毫不輸給SPSS的軟體,另外一個強勁對手則是Python,Python在業界可說是殺手級的應用。加上R和Python免費、開源的特性(也有些商業的加值解決方案),即使以後SPSS可能會漲到天價,還真的一度聽說貴到有公立學校買不起,你還是可以自己跑統計,出社會工作也差不多。以馬克思主義的觀點,你沒有生產工具就只有任資本家宰割的份,所以就忍耐一下學習過程可能的痛苦吧。但是學習總是很痛苦的,多變量課程通常一週需要至少9個小時的課程準備,對於電腦新手可能更是如此。不過我覺得,與其讓後進像我們一樣整天翻找網路、工具書還找不出答案,不如提供一些解答的範本,讓後進者可以按圖索驥。以前寫迴圈的時候寫不出來,也是拿學長給的R語法來應急,放心老師知道也樂於讓我們用這個方式寫作業,唯請標明出處或歷程。
By 肥貓, 7 十二月, 2020 @ 肥貓的異想世界 Linux上幾個實用的PDF工具 在學術單位工作或唸書,無可避免會處理大量PDF。然而現行業界常用的Adobe Acrobat要價不斐,絕非一般人所能輕易負擔;雖然好一點的學校有校園授權軟體,但是除非你能遠端連線,或學校距離你家很近,否則遠水救不了近火。 所幸,在Linux系統就有幾個實用的PDF處理軟體,而且免費。其中最主要的是pdf-shuffler。若想用最方便的方式安裝,在Debian/Ubuntu可用以下指令: sudo apt install pdfshuffler 其主要用途,是可對PDF每一頁分別進行順時鐘/逆時鐘旋轉、分割、組合等。雖然程序與方便性,可能遠不及Adobe Acrobat的一鍵合併文件功能,但是尚稱實用。不過據我了解,Adobe Acrobat將Word擋轉存PDF的功能,是必須在有MS Office的前提下進行,若你只有Windows和LibreOffice,Acrobat的轉檔功能可能同樣無用武之地。所以你最好還是用Word或LibreOffice內建功能,事先把PDF存好。
By 肥貓, 7 十二月, 2020 @ 肥貓的異想世界 2020 g0v峰會參與心得(初稿) 原本我只計劃遠端參與g0v 2020的台南峰會,原因不外乎距離稍遠、論文纏身、在台南市區轉換場地的距離與技術困難、一開始想聽的場次不多等。不過在教授鼓勵,與獲得開放文化基金會很阿莎力的補助下,加上周四早班普悠瑪訂不到只能搭高鐵,乾脆狠下心搭早班高鐵一口氣參加了周四的面海松、周五、周六的Summit;周日因為有事,所以周六晚上就從成大搭台鐵+高鐵回台北。雖然很累,但是整體而言過程頗為值得。