移至主內容
首頁
SLAT Blogs

主導覽

  • 首頁
使用者帳號選單
  • 登入

導航連結

  1. 首頁

肥貓的異想世界

By 肥貓, 4 八月, 2021 @ 肥貓的異想世界

用R做簡單(但實用)的資料整併

近期需要從較老舊的圖書館系統匯出想借閱的書目列表,資料結構大概長這樣:

________________________________________

裝訂及其他區別字樣:平裝 

發行性質/價格:新臺幣780元 

一般性資料:20160111d2015 k y0chiy09 e 

正文語文:chi 

......

_________________________________________

但是上面那樣顯然不是適合人閱讀的報表,也不利後續利用。因此需要整理成如下圖的樣式:

By 肥貓, 14 七月, 2021 @ 肥貓的異想世界

試解決Professional FTP(Pro FTPD)佈署時的常見問題

這幾天嘗試在家嘗試架設臨時性的FTP,方便區網內兩台電腦互傳檔案之用。雖然李博明老師寫的Pro FTP(容許匿名登入)的架設說明淺顯易懂,實際操作卻踢到鐵板。可能的原因是文章過舊而與現況不符;也可能是因為我是在Ubuntu上操作,而與原文使用的Debian仍有相當差距。總之我寫這篇的目的不是戰李老師,而是希望補充一些細節或解答,讓後進能少走些冤枉路。

該鐵板簡稱530 Error(或登入不正確),至少在FileZilla用localhost測試看到是這樣。該代號簡單說就是密碼錯誤,但是既然是匿名登入,那還需要什麼密碼?爬了許多文還是解決不了,只好請教協會聊天室裡的先進。得到的解法整理如下:

  • 建議改裝proftpd套件

李老師的演示是安裝proftpd-basic套件。不過個人實測後,建議改裝(功能似乎也比較完整的)proftpd套件,因為系統設定後者套件時,會自動加入一些運作必須的資料夾和設定,可以減少許多後續設定的麻煩。

By 肥貓, 4 七月, 2021 @ 肥貓的異想世界

用R處理字串的簡單示範

因為我喜歡將從開放式課程網頁下載得到的影片檔轉換成音檔,存入手機等方便隨身攜帶與收聽,便衍生出使用命令列(本例為ffmpeg)批次處理的需求。一種方法是用WinFF來代勞,但是若有客製化需求的時候,直接打命令列還是比較乾脆。但是我當然不想傻傻地一個一個檔案慢慢key,便需要利用R的字串處理工具,把變數(如檔案路徑與名稱)和命令式整合在一起。以下示範相關過程與程式碼。

  • 前處理:設定變數與欄位

第一步是先設定變數與欄位,所以我先在Calc做了兩欄,一欄是來源檔的檔名和路徑(在Ubuntu,你可以透過複製該檔,在Calc直接以純文字貼上該檔案路徑);另一欄則是你想要的格式,如果你想做得細一點,也可以再新增一欄鍵入各種參數。

由於R的匯入資料功能使用xls檔比較方便,所以我最後是將其存成xls檔,而非開放格式的ods或csv等格式。

By 肥貓, 10 五月, 2021 @ 肥貓的異想世界

試解決LibreOffice Writer圖表標號數字(小寫)與章節標號數字(大寫)不一致的問題

近日論文口試通過,再經過幾次大修就要送印、送圖書館準備畢業。重頭戲是把之前沒時間顧慮的一些內文用語、排版問題等弄好,畢竟論文是拿來給後人鞭屍的,許多事情可馬虎不得。

不過肥貓這下踢到第一塊鐵板,因為中文學位論文的章節編排是第一章、第一節...一字排開,若在圖表標號時,直接套按章的層級去編號的話,就會發生如圖中啼笑皆非的後果。

但是如果改第一章、第一節的編號,變成小寫數字1,就會變成另一邊有麻煩的問題了;可說是順了姑意逆了嫂意。有些人是索性不理格式規範,直接還是用圖1...圖15的編排去做,反正如果指導教授沒說什麼,圖書館大概也不會刁難。但是如果你是很龜毛的人,那該怎麼辦呢?

之前有問過其他講師,用的方法不外乎要改多層次清單。我知道Word上很多人這樣用,可是這樣不但操作複雜,而且沒弄好可能還會破壞編碼結構,我的文件就被自己搞壞好幾次,只好回溯前一版。我們不管怎麼做,其實都是用假的變數欺騙系統,叫他採用我們要的變數而已,但是如果「騙得」不夠有邏輯、高明,很容易編碼簿就亂掉釀成更大災難。

By 肥貓, 8 五月, 2021 @ 肥貓的異想世界

R語言用於基礎敘述統計的示範

最近因為支援會議所需,被委託處理與會者的資料。雖然都是敘述統計,但是現有的商業軟體難以滿足兼顧效率與經濟的需求。

  1. Excel製作次數分配表(Frequency)的步驟很繁瑣,我看過有人用樞紐分析表做,但看了眼花撩亂。

  2. 即使製成表之後,Excel用滑鼠點放製作圓餅圖、直條圖的方式也非常繁瑣,實在難以勝任同時要處理數十張圖的任務。

By 肥貓, 19 二月, 2021 @ 肥貓的異想世界

歷屆多變量課程相關檔案釋出

2019年在政大修了蕭乃沂老師的多變量課程,照往例課程要求除了要用SPSS跑出結果之外,還要用R再做一次。平心而論,R是一個在業界效能絲毫不輸給SPSS的軟體,另外一個強勁對手則是Python,Python在業界可說是殺手級的應用。加上R和Python免費、開源的特性(也有些商業的加值解決方案),即使以後SPSS可能會漲到天價,還真的一度聽說貴到有公立學校買不起,你還是可以自己跑統計,出社會工作也差不多。以馬克思主義的觀點,你沒有生產工具就只有任資本家宰割的份,所以就忍耐一下學習過程可能的痛苦吧。

但是學習總是很痛苦的,多變量課程通常一週需要至少9個小時的課程準備,對於電腦新手可能更是如此。不過我覺得,與其讓後進像我們一樣整天翻找網路、工具書還找不出答案,不如提供一些解答的範本,讓後進者可以按圖索驥。以前寫迴圈的時候寫不出來,也是拿學長給的R語法來應急,放心老師知道也樂於讓我們用這個方式寫作業,唯請標明出處或歷程。

By 肥貓, 7 十二月, 2020 @ 肥貓的異想世界

Linux上幾個實用的PDF工具

在學術單位工作或唸書,無可避免會處理大量PDF。然而現行業界常用的Adobe Acrobat要價不斐,絕非一般人所能輕易負擔;雖然好一點的學校有校園授權軟體,但是除非你能遠端連線,或學校距離你家很近,否則遠水救不了近火。

所幸,在Linux系統就有幾個實用的PDF處理軟體,而且免費。其中最主要的是pdf-shuffler。若想用最方便的方式安裝,在Debian/Ubuntu可用以下指令:

sudo apt install pdfshuffler

其主要用途,是可對PDF每一頁分別進行順時鐘/逆時鐘旋轉、分割、組合等。雖然程序與方便性,可能遠不及Adobe Acrobat的一鍵合併文件功能,但是尚稱實用。不過據我了解,Adobe Acrobat將Word擋轉存PDF的功能,是必須在有MS Office的前提下進行,若你只有Windows和LibreOffice,Acrobat的轉檔功能可能同樣無用武之地。所以你最好還是用Word或LibreOffice內建功能,事先把PDF存好。

By 肥貓, 7 十二月, 2020 @ 肥貓的異想世界

2020 g0v峰會參與心得(初稿)

原本我只計劃遠端參與g0v 2020的台南峰會,原因不外乎距離稍遠、論文纏身、在台南市區轉換場地的距離與技術困難、一開始想聽的場次不多等。不過在教授鼓勵,與獲得開放文化基金會很阿莎力的補助下,加上周四早班普悠瑪訂不到只能搭高鐵,乾脆狠下心搭早班高鐵一口氣參加了周四的面海松、周五、周六的Summit;周日因為有事,所以周六晚上就從成大搭台鐵+高鐵回台北。雖然很累,但是整體而言過程頗為值得。

By 肥貓, 29 十月, 2020 @ 肥貓的異想世界

麻瓜入坑Ubuntu指南(第1彈)

  • 前言

這個題目說來奇怪,畢竟坊間已經有不少輔助麻瓜(非技術使用者)安裝和使用Linux,特別是Ubuntu的說明書籍,實在不需要我再寫一篇廢文。不過發現還是有很多問題,不是把說明書放在電腦旁供著就能解決。(*註:這裡的麻瓜,泛指多數非技術使用者,並沒有如哈利波特小說中的貶義。)

第一個問題在於使用者的心態,近日在校園觀察,發現許多人開始對Linux有興趣,但是總是不敢踏出第一步,導致最後說明書看完還是流於紙上談兵。但是如同小孩學走路,不管結果是成功還是失敗,這個第一步其實很重要,起碼你已經開始跨進Linux的世界,也終於開始向軟體大廠爭奪電腦軟體的使用權。我不想把L. Lessig的網路自由思想在這裡扯個沒完,但是如果消費者對電腦廠商預裝不想要的軟體(如Candy Crush或WPS Office),或者Windows三不五時更新後更改你的預設程式頗為反感(例如Groove音樂或Edge瀏覽器)。我的看法會稍微激進點,光是罵業者是沒用的,反正他們其實也不稀罕你用(況且你也乖乖聽話啦),應該直接以跳坑Linux來表達你的訴求。

By 肥貓, 10 十月, 2020 @ 肥貓的異想世界

活動直播工具的轉型倡議

近日許多跡象顯示,武漢肺炎在歐洲與美國有再次流行的可能,確診與死亡人數也再次攀升。台灣雖然疫情趨緩,至少近期未再發生社區感染,然而仍有境外移入與潛在感染者的風險;加上國人防疫意識逐漸鬆懈,群聚場合佩戴口罩與維持社交距離似乎也不再嚴格執行,入冬後仍可能發生交叉感染。雖然這說法可能過於杞人憂天,推論基礎應該與現況不會差距太遠。雖然很烏鴉嘴,但是如果真的這一天到來時,教會(乃至於所有組織)的聚會直播仍然必須嚴陣以待,甚至超前佈署。

關於虛實整合的文章,我上次已經談過一輪,看法基本上也沒有改變。如果虛實整合沒做好,這個直播也只是流於形式。這次則來談談工具的層面。

Pagination

  • First page
  • Previous page
  • 頁面 1
  • 頁面 2
  • 頁面 3
  • 頁面 4
  • 頁面 5
  • 下一頁
  • Last page
肥貓's blog

部落格列表

管理日誌
LibreOffice 正體中文文件
肥貓的異想世界
軟體自由運動部落格
馬哥的大小事
My Libre World
社會派宅爸

最新文章

續1:用QGIS處理有斷點的資料的示範--以杭溫高速鐵路溫州北站附近為例(OpenStreetMap)
用QGIS處理有斷點的資料的示範--以杭溫高速鐵路溫州北站附近為例(OpenStreetMap)
用Python/QGIS篩選地理資料的簡短示範
我的 2025 回顧
LibreOffice x GSoC 2025 成果報告
LO Conf 2025 精彩回顧:奧地利軍隊的開源轉型之路
試用Python製作一支簡單的爬蟲程式
試用Python製作一支簡單的考試程式
Interview with Sandy Corzeta, Admin of Indonesia's Fediverse Instance 'misskey.id'
簡單處理在Ubuntu終端機啟動Miniconda的問題
在LibreOffice Calc利用Vlookup做精準搜尋
現在就加入 LibreOffice 團隊當全職開發者,處理 RTL/CTL/CJK 等事宜!
Powered by Drupal