By 肥貓, 4 八月, 2021 @ 肥貓的異想世界 用R做簡單(但實用)的資料整併 近期需要從較老舊的圖書館系統匯出想借閱的書目列表,資料結構大概長這樣: ________________________________________ 裝訂及其他區別字樣:平裝 發行性質/價格:新臺幣780元 一般性資料:20160111d2015 k y0chiy09 e 正文語文:chi ...... _________________________________________ 但是上面那樣顯然不是適合人閱讀的報表,也不利後續利用。因此需要整理成如下圖的樣式:
By 肥貓, 14 七月, 2021 @ 肥貓的異想世界 試解決Professional FTP(Pro FTPD)佈署時的常見問題 這幾天嘗試在家嘗試架設臨時性的FTP,方便區網內兩台電腦互傳檔案之用。雖然李博明老師寫的Pro FTP(容許匿名登入)的架設說明淺顯易懂,實際操作卻踢到鐵板。可能的原因是文章過舊而與現況不符;也可能是因為我是在Ubuntu上操作,而與原文使用的Debian仍有相當差距。總之我寫這篇的目的不是戰李老師,而是希望補充一些細節或解答,讓後進能少走些冤枉路。 該鐵板簡稱530 Error(或登入不正確),至少在FileZilla用localhost測試看到是這樣。該代號簡單說就是密碼錯誤,但是既然是匿名登入,那還需要什麼密碼?爬了許多文還是解決不了,只好請教協會聊天室裡的先進。得到的解法整理如下: 建議改裝proftpd套件 李老師的演示是安裝proftpd-basic套件。不過個人實測後,建議改裝(功能似乎也比較完整的)proftpd套件,因為系統設定後者套件時,會自動加入一些運作必須的資料夾和設定,可以減少許多後續設定的麻煩。
By 肥貓, 4 七月, 2021 @ 肥貓的異想世界 用R處理字串的簡單示範 因為我喜歡將從開放式課程網頁下載得到的影片檔轉換成音檔,存入手機等方便隨身攜帶與收聽,便衍生出使用命令列(本例為ffmpeg)批次處理的需求。一種方法是用WinFF來代勞,但是若有客製化需求的時候,直接打命令列還是比較乾脆。但是我當然不想傻傻地一個一個檔案慢慢key,便需要利用R的字串處理工具,把變數(如檔案路徑與名稱)和命令式整合在一起。以下示範相關過程與程式碼。 前處理:設定變數與欄位 第一步是先設定變數與欄位,所以我先在Calc做了兩欄,一欄是來源檔的檔名和路徑(在Ubuntu,你可以透過複製該檔,在Calc直接以純文字貼上該檔案路徑);另一欄則是你想要的格式,如果你想做得細一點,也可以再新增一欄鍵入各種參數。 由於R的匯入資料功能使用xls檔比較方便,所以我最後是將其存成xls檔,而非開放格式的ods或csv等格式。
By 肥貓, 10 五月, 2021 @ 肥貓的異想世界 試解決LibreOffice Writer圖表標號數字(小寫)與章節標號數字(大寫)不一致的問題 近日論文口試通過,再經過幾次大修就要送印、送圖書館準備畢業。重頭戲是把之前沒時間顧慮的一些內文用語、排版問題等弄好,畢竟論文是拿來給後人鞭屍的,許多事情可馬虎不得。 不過肥貓這下踢到第一塊鐵板,因為中文學位論文的章節編排是第一章、第一節...一字排開,若在圖表標號時,直接套按章的層級去編號的話,就會發生如圖中啼笑皆非的後果。 但是如果改第一章、第一節的編號,變成小寫數字1,就會變成另一邊有麻煩的問題了;可說是順了姑意逆了嫂意。有些人是索性不理格式規範,直接還是用圖1...圖15的編排去做,反正如果指導教授沒說什麼,圖書館大概也不會刁難。但是如果你是很龜毛的人,那該怎麼辦呢? 之前有問過其他講師,用的方法不外乎要改多層次清單。我知道Word上很多人這樣用,可是這樣不但操作複雜,而且沒弄好可能還會破壞編碼結構,我的文件就被自己搞壞好幾次,只好回溯前一版。我們不管怎麼做,其實都是用假的變數欺騙系統,叫他採用我們要的變數而已,但是如果「騙得」不夠有邏輯、高明,很容易編碼簿就亂掉釀成更大災難。
By 肥貓, 8 五月, 2021 @ 肥貓的異想世界 R語言用於基礎敘述統計的示範 最近因為支援會議所需,被委託處理與會者的資料。雖然都是敘述統計,但是現有的商業軟體難以滿足兼顧效率與經濟的需求。 Excel製作次數分配表(Frequency)的步驟很繁瑣,我看過有人用樞紐分析表做,但看了眼花撩亂。 即使製成表之後,Excel用滑鼠點放製作圓餅圖、直條圖的方式也非常繁瑣,實在難以勝任同時要處理數十張圖的任務。
By 肥貓, 19 二月, 2021 @ 肥貓的異想世界 歷屆多變量課程相關檔案釋出 2019年在政大修了蕭乃沂老師的多變量課程,照往例課程要求除了要用SPSS跑出結果之外,還要用R再做一次。平心而論,R是一個在業界效能絲毫不輸給SPSS的軟體,另外一個強勁對手則是Python,Python在業界可說是殺手級的應用。加上R和Python免費、開源的特性(也有些商業的加值解決方案),即使以後SPSS可能會漲到天價,還真的一度聽說貴到有公立學校買不起,你還是可以自己跑統計,出社會工作也差不多。以馬克思主義的觀點,你沒有生產工具就只有任資本家宰割的份,所以就忍耐一下學習過程可能的痛苦吧。但是學習總是很痛苦的,多變量課程通常一週需要至少9個小時的課程準備,對於電腦新手可能更是如此。不過我覺得,與其讓後進像我們一樣整天翻找網路、工具書還找不出答案,不如提供一些解答的範本,讓後進者可以按圖索驥。以前寫迴圈的時候寫不出來,也是拿學長給的R語法來應急,放心老師知道也樂於讓我們用這個方式寫作業,唯請標明出處或歷程。
By 肥貓, 7 十二月, 2020 @ 肥貓的異想世界 Linux上幾個實用的PDF工具 在學術單位工作或唸書,無可避免會處理大量PDF。然而現行業界常用的Adobe Acrobat要價不斐,絕非一般人所能輕易負擔;雖然好一點的學校有校園授權軟體,但是除非你能遠端連線,或學校距離你家很近,否則遠水救不了近火。 所幸,在Linux系統就有幾個實用的PDF處理軟體,而且免費。其中最主要的是pdf-shuffler。若想用最方便的方式安裝,在Debian/Ubuntu可用以下指令: sudo apt install pdfshuffler 其主要用途,是可對PDF每一頁分別進行順時鐘/逆時鐘旋轉、分割、組合等。雖然程序與方便性,可能遠不及Adobe Acrobat的一鍵合併文件功能,但是尚稱實用。不過據我了解,Adobe Acrobat將Word擋轉存PDF的功能,是必須在有MS Office的前提下進行,若你只有Windows和LibreOffice,Acrobat的轉檔功能可能同樣無用武之地。所以你最好還是用Word或LibreOffice內建功能,事先把PDF存好。
By 肥貓, 7 十二月, 2020 @ 肥貓的異想世界 2020 g0v峰會參與心得(初稿) 原本我只計劃遠端參與g0v 2020的台南峰會,原因不外乎距離稍遠、論文纏身、在台南市區轉換場地的距離與技術困難、一開始想聽的場次不多等。不過在教授鼓勵,與獲得開放文化基金會很阿莎力的補助下,加上周四早班普悠瑪訂不到只能搭高鐵,乾脆狠下心搭早班高鐵一口氣參加了周四的面海松、周五、周六的Summit;周日因為有事,所以周六晚上就從成大搭台鐵+高鐵回台北。雖然很累,但是整體而言過程頗為值得。
By 肥貓, 29 十月, 2020 @ 肥貓的異想世界 麻瓜入坑Ubuntu指南(第1彈) 前言 這個題目說來奇怪,畢竟坊間已經有不少輔助麻瓜(非技術使用者)安裝和使用Linux,特別是Ubuntu的說明書籍,實在不需要我再寫一篇廢文。不過發現還是有很多問題,不是把說明書放在電腦旁供著就能解決。(*註:這裡的麻瓜,泛指多數非技術使用者,並沒有如哈利波特小說中的貶義。) 第一個問題在於使用者的心態,近日在校園觀察,發現許多人開始對Linux有興趣,但是總是不敢踏出第一步,導致最後說明書看完還是流於紙上談兵。但是如同小孩學走路,不管結果是成功還是失敗,這個第一步其實很重要,起碼你已經開始跨進Linux的世界,也終於開始向軟體大廠爭奪電腦軟體的使用權。我不想把L. Lessig的網路自由思想在這裡扯個沒完,但是如果消費者對電腦廠商預裝不想要的軟體(如Candy Crush或WPS Office),或者Windows三不五時更新後更改你的預設程式頗為反感(例如Groove音樂或Edge瀏覽器)。我的看法會稍微激進點,光是罵業者是沒用的,反正他們其實也不稀罕你用(況且你也乖乖聽話啦),應該直接以跳坑Linux來表達你的訴求。
By 肥貓, 10 十月, 2020 @ 肥貓的異想世界 活動直播工具的轉型倡議 近日許多跡象顯示,武漢肺炎在歐洲與美國有再次流行的可能,確診與死亡人數也再次攀升。台灣雖然疫情趨緩,至少近期未再發生社區感染,然而仍有境外移入與潛在感染者的風險;加上國人防疫意識逐漸鬆懈,群聚場合佩戴口罩與維持社交距離似乎也不再嚴格執行,入冬後仍可能發生交叉感染。雖然這說法可能過於杞人憂天,推論基礎應該與現況不會差距太遠。雖然很烏鴉嘴,但是如果真的這一天到來時,教會(乃至於所有組織)的聚會直播仍然必須嚴陣以待,甚至超前佈署。 關於虛實整合的文章,我上次已經談過一輪,看法基本上也沒有改變。如果虛實整合沒做好,這個直播也只是流於形式。這次則來談談工具的層面。