分類: 製書需知

看不到mPDB底部:mPDB與顯示屏幕看不到mPDB底部:mPDB與顯示屏幕

好讀志工分享:開啟mPDB,準備製書或校對之際,卻發現mPDB底下的欄目看不到—底部只能顯示到這裏(如下圖所示),再底下的內容就看不到了。

您遇過這種情況嗎?怎麼辦?

請放心,mPDB的底部仍在,只是被Windows工作列遮蓋了。

由於周博士早在十多年前開發mPDB;時至今日,mPDB未能自動配合當今顯示屏幕的需求。

解決方法:請開啟Windows「系統(System)」,選擇「顯示」(Display),然後根據您的屏幕尺寸需要:

1. 嘗試調校高低不同的屏幕分辨率(Display resolution)〔mPDB的最低需求是1024×768〕;

2. 縮小比例(Scale)〔例如比例高於100%的話,請將之稍微下調〕。

讓mPDB變得大小適中,切合您的顯示屏幕,然後就可以看清mPDB全貌。

如果您有興趣來試著製書或作校正,請聯絡好讀與站長溝通,非常感謝。

書籍校正工作流程:操作mPBD篇書籍校正工作流程:操作mPBD篇

今天編輯部與踴躍貢獻的好讀校正志工交流心得,深感榮幸和興奮,溫故知新,大家獲益良多。

交流分享期間,校正隊友方才發現:好讀校正工作一路走來,全賴好讀之友各師各法,遺憾至今尚欠一個關於如何操作mPBD去作書籍校正的步驟流程。

故此,今天我們集思廣益,得出以下尚待完善的「運用mPBD校正的流程清單」:

1. 請先建立一個mPDB文件夾。

2. 下載mPDB26.zip,然後解壓縮至mPDB文件夾。

3. 下載需校正的updb檔案。

4. 建立另一個文件夾,將updb檔案放進去。

5. 開啟mPDB.exe,打開這個updb檔。

6. 打開mPDB文件夾,看到有一個名字怪怪的txt檔案,請將它重新命名為「錯別字」。

7. 下載及打開該書的錯別字名單「log.txt」,複製該書需要校正之處,然後如下圖所示,貼在「錯別字.txt」之上,並且儲存。

8. 回到mPDB,按右方「校正」鍵,系統將詢問「校正錯別字?」,請按OK。

9. 接著,系統將告訴我們一共有多少個可校正之處,並詢問要否修改這些錯處。請逐一選擇OK或YES。

10. 校正完成。在mPDB按「直式標點」,再按「轉成updb」,產出updb。

11. 確認內容仍用直式標點,按「直式epub」,產出直式epub。

11. 按「橫式標點」,再按「epub」,產出橫式epub。

12. 最後,提交這三個檔案(uPDB、直式epub、橫式epub)。大功告成。

希望以上流程可助校正隊友一臂之力。

如果您有興趣來試著作書籍校正,請聯絡好讀與站長溝通,非常感謝。

電子書製作過程:2022版本電子書製作過程:2022版本

有許多讀者來詢問如何製作類似於網站上所發布的電子書。製作電子書所需的時間將根據書的長度以及可用的設備和軟件工具而有所不同。以下的過程是假設使用開源或免費的軟體來製作一本 100 頁的書。

這製作電子書的過程可以分為四大部分。

第一步:掃描這一本書的每一頁,並轉換成一系列掃描的圖像文件。每頁大約有需要二到四分鐘來掃描,一本一百頁的書有可能需要大約三百分鐘,或大約五個小時來完成掃描。

第二步:掃描的圖像需要通過光學字元辨識(OCR)軟件來轉換為成文字檔。Google Docs 是可以考慮來作為 OCR 的免費工具。當您打開帶有掃描圖像的文件時,Google Docs 會嘗試將其看到的字符轉換為純文字。 然後,您可以將轉換後的文字保存到另一個文字檔中。每張轉換圖像並保存識別的文字可能需要一到三分鐘。一本一百頁的書有可能需要大約三到四個小時來執行 OCR。

在此時,這最後整本書的文字檔也就是您未經編輯的手稿。

第三步:您將需要使用軟件工具來格式化您的手稿,已可以最後來製作 EPUB 格式的電子書。市場上有許多書籍創作軟件可以考慮去用。其中比較有些知名度的開源電子書製作軟件是 Sigil(https://sigil-ebook.com/get/) 和 Calibre(https://calibre-ebook.com/)。周博士之前所開發的好讀製書程式 mPDB 軟件也可以用在這一步。

您可以下載軟件並在您的手稿上來試用。學習如何操作軟件和製作第一本電子書所需要的時間會取決於個人。在這步上花個五到二十個小時來製作第一本電子書,並同時學習製作書的工具,這聽起來該是蠻合理的。

第四步:一旦你把手稿變成了一本電子書,最後一步就是作編輯並糾正錯誤。 OCR 的準確率不會是百分之百,通讀一遍(或多次)來發現並糾正錯別字是非常有可能的。這項編輯的過程很容易需要數小時或是幾天才能完成。 此外,使用電子書的出版工具(例如 Sigil 和 Calibre 和 mPDB)的熟練程度也會影響到這編輯過程所需要的時間。

以上我們概述了製作電子書的四個大步驟。 如果您知道有其他適合用於製作 EPUB 書籍的免費或開源工具,請隨時與我們分享。謝謝。

製書需知:從這裡開始製書需知:從這裡開始

好讀不是出版社。站上的電子書都是讀友辛苦整理製作的。古籍和絕版的好書,因無商業價值,只有靠大家的協力製成高品質的電子書,現在和未來的人才有機會一睹,才能抽空再欣賞。若您也想將手頭的紙本舊書整理製作成電子書和大家分享,請參看以下的說明。

分享電子書的格式

並非任何書都可放在好讀分享。好讀是讀友協力清理正體中文電子書的平台。為了方便清理修正,只接受好讀updb檔電子書。沒人有興趣製作的書,好讀不會有。未經過整理製作的書,好讀也不會放。好讀不接受目前熱賣的書,也不接受在網路上信手捻來的文字檔或epub檔。

製書是終身嗜好

好讀早期,放了不少《經典版》的書。那時大家都搞不清楚狀況,興沖沖由網上找來一些書,就以為是原書。製成電子書一讀才發現差得遠了。經過製作者的努力修正,後讀者的不斷勘誤,雖尚可一讀,但因無人仔細核對過原書,難免有些無法修復的缺漏。品質實在不佳的,無法化腐朽為神奇的,多已下架。

為了確保品質並方便勘誤查核,2017年起,分享新書僅上架:
一、按正體原書整理製作的《典藏版》;
二、有正體原書掃描檔可供查核的。

會使用mPDB,要將一個現成的或OCR出來的文字檔製作成updb檔,不過是幾分鐘的舉手之勞。若原始文字檔的品質不是很好,要整理修正到自己讀得下去,至可以和大家分享的水準,就很費時費事了。那麼,為什麼卻有這麼多的讀友樂此不疲,不斷在製作高品質的好書和大家分享?

理由很簡單,製作出一本高品質的電子書是成就,也是貢獻,是會上癮的。

不是每個人都能寫作,製書則隨時可以開始。即使目前時間不多,每天或每週抽出一點時間,養成製書的嗜好,未來時間多的時候,不愁沒有利己利人的好事可做。看看四遭,不是有很多的人,年輕時忙到連睡覺的時間都沒有,目前卻多到除了睡覺,就不知道要幹什麼才好的?

製作什麼樣的書比較好?

自己喜愛或懷念,想讀或重讀的書。最好是有原書可以參照核對的。

隨手翻閱一本書,可以跳著看或囫圇吞棗,只求快速瞭解情節或文意,半天一天就看完了。製作校正一本書,要按原書逐字核對,也許一天只能完成一章或一回,十頁或二十頁。

按原書逐字校正是精讀,是磨練專注。細心品嚐作者的用字用辭用心,或有不同的體會。遇到不解之處,順手查證字典,也增加國學的知識。

感謝讀友陸續提供掃描檔,數量已逾數千本,未來會逐步擇書請求讀友協助製作。若您的時間不多,可參與分工校正,或邀請同好協力將站上的經典版重校成典藏版。

若您手頭的愛書,好讀沒有,不妨先掃描。掃描檔在螢幕上可放大縮小,會比紙本容易比對。若不會OCR,沒有關係,可請讀友幫忙。

按原書校正的最大好處:

輕鬆,隨時可停,隨時可再開始。不用猜解,遇到缺漏或疑惑之處,按原書補齊或修正即可。當然原書也可能有錯,明顯的可順手修正;無法查證確定的,則不改比較好。

按原書校正的注意事項:

一、換場景(這一項最重要,因為無法用mPDB修改)

常見的方法是用空白行分隔,也有些書是用一些特別符號分隔。請一律按好讀電子書的慣例,改用以下一行分隔,兩個空格,三個※,

※※※

在小螢幕上較易分辨,也避免日後空白行被刪除不見等問題。

二、段落(可用mPDB快速修改)

  • 請按原書調整。
  • 段首縮排,請用兩個全型的空格「  」,不要用四個半型的空格。
  • 段落之間,請加空白行分隔。

三、請使用全型的標點符號(可用mPDB快速修改)

  • 常用的有,。、:;?!※*
  • 鉛字有 ?! 合一的符號,請分開輸入成?!
  • 括號:()《》〈〉
  • 破折號:──
  • 刪節號:……
  • 單引號「」雙引號『』的使用規則:先單後雙。先用單引號,單引號內再用雙引號。舊書若先雙後單,請統一規格,改成先單後雙。

四、常見字可用俗字取代(可用mPDB快速修改)

常見字,原書若使用較舊的鉛字體(Unicode碼),是當時印書的限制,可以改用習以為常的俗字體(Big5碼),一則無傷大雅,二則避免缺字或字型不一反而難看。以下列了一些:

爲/為, 麽/麼, 着/著, 敎/教, 卽/即, 旣/既, 靑/青, 眞/真, 寃/冤, 却/卻, 駡/罵

五、罕見字請用原書中的字(無法用mPDB修改)

不知如何輸入的字,請註明如(左口右歐),讓編輯修改。一些常見,但較難輸入的字,列於下,可以剪貼:

嘭、咣、噼、噝、嗞、嗬、咔、唿、哐、嗵、 嗗、哚、喼、啫、唂、噔

六、方便讀友清爽閱讀

原書中無助於(或曰干擾)閱讀的廣告詞、推薦文、導讀、謝辭、眉批或評語等,請不要加入電子檔內。

七、註解

原書位於頁尾或章尾的註解要如何處理?因為電子書的頁面依閱讀器有異,且不似紙本書那麼容易快速來回翻頁,請將註解移至被釋處之下,如雪天使〔譯註:「雪天使」(snow angel)是在雪地上玩的遊戲,整個人仰躺在厚厚的積雪中,然後用力擺動四肢,在雪地上劃出一道道痕跡。〕若釋文很長,也可緊接被釋段落之後,另開一個段落說明。

怎麼還會有錯?

仔細校正的書仍被讀友抓包。這是正常,不必太洩氣。每個人校書都有盲點,即使再校一遍,有些錯仍會視而不見。要換個人看,或用mPDB去掃容易跳過的錯,才可能完美。

實際上,要完全沒錯太費神了,應該留點好事讓其他讀友做。林語堂說得好:「美國有一個雜誌編輯者,為了要嚴密校正錯字,就連頭髮也校得灰白。中國的編輯便聰明得多,他把幾個沒校出來的錯字留下,以便增加讀者發現錯誤的樂趣,增加讀者細心觀察的能力。」(見【生活的藝術】第七章 悠閒的重要 六、美國三大惡習)

請提供掃描檔:

方便日後有讀友勘誤時,好讀可以核對,以免誤改。感謝!

製書工具

好讀的updb檔規格很簡單,僅是文字加上章節目錄,方便製作和修正。製作和修正updb檔的工具是好讀製書程式,mPDB。

製書的第一步是熟悉工具,請先用mPDB擷取出一個updb檔中的文字檔來看看。方法很簡單,常見的問題如下:

A1. 如何開啟好讀updb/pdb檔?
B1. 如何將好讀updb檔轉成epub檔?
B2. 如何將好讀updb檔轉成txt檔?
B3. 如何將好讀updb檔轉成prc檔?
C1. 如何新增製書設定檔?
C2. 如何開啟製書設定檔?
C3. 如何儲存製書設定檔?
D1. 如何由一個文字檔快速製書?
D2. 如何逐章快速製書?
E1. 如何快速切割章節?
E2. 如何快速產生目錄
E3. 如何快速產生updb/pdb檔

勘誤需知勘誤需知

閱讀沒錯字的電子書是人生的一大樂事。好讀也提供了你方便的閱讀環境,看到錯字請別懊惱,提報一下,好讀就更完美了。

幾乎每天都會收到勘誤表。因每個人對錯別字的認知不一,每個勘誤表都需要肉眼逐項再判斷是否能改。都正確的改起來很輕鬆;看來有疑問的,要另花時間再查證的,改起來就很痛苦。敬請有意提供勘誤表的讀友,先細看以下的說明:

勘誤不是改作文。自己寫的書,愛用什麼字都可;別人寫的書,也請尊重一下原作者不要隨便改,除非是很明顯的輸入錯誤。

勘誤表不需完整,能列出幾個一看就讓人同意是該改的即可。幾年前放上的書,多少會有一些錯當時沒掃到,即使你未全列,我在更新時會都重新掃錯及檢查標點,也許就改掉了。所以常見的芝麻小錯不用列,或說不列也沒關係,因為十之八九你不列我也會掃到。要列的是程式不太容易判斷的錯,譬如說人名誤植,或按上下文才能判斷的。

勘誤準則:(可能也對也通的,請勿列在勘誤表上。)

  1. 請用站上最新版的書檔勘誤。
  2. 勘誤是改錯,明顯的錯當然改。
  3. 通用字、也正確的、無傷大雅的,能不改就不改,免得大家喜好不一,改來改去為難。有原書可核的,依原書的用字。
  4. 勘誤不是改寫,原作者、譯者文筆欠佳之處,見仁見智,除非很不通順,不改比較好。
  5. 有上下句不能連貫的地方,很可能是多字缺字,或缺段漏頁。這種情況只有一解:就是找原書來補。

勘誤表規格

  1. 電子書是電子檔,修正要靠電腦幫忙。
  2. 電腦不需要知道章節、也不需要知道頁數。
  3. 電腦只需要知道哪幾個字要換成哪幾個字。
  4. 要跟電腦說:「這幾個字要換成這幾個字。」的格式很簡單,將「要換成」三個字用「/」代表即可:
    這幾個字/這幾個字
  5. 範例:(一個錯一行)
    匆勿忙忙/匆匆忙忙
    寒喧/寒暄
    作案現常/作案現場
    淡淡他說:/淡淡地說:
  6. 電腦是全書搜尋。只要是這幾個字都會換成這幾個字。所以同樣的錯,只需要列一次。譬如說「寒喧」全書有好幾處,只需要列一次:寒喧/寒暄
  7. 若同樣的幾個字,並非全書都可改,請多列相鄰幾個字以便區分,否則電腦全改了。譬如說「他說」兩字全書到處都有,要將某處「他說」改成「地說」,不能只列:
    他說/地說
    一定要多列幾個字如:
    淡淡他說:/淡淡地說:
  8. 為了避免電腦閉著眼睛全改了,電腦每找到一處,都要先請教人腦是否能改。請體貼一點,多列相鄰幾個字,減少無謂的判斷,人腦感謝你。
  9. 每本書的勘誤表,請集中成一個勘誤表上傳,方便一次作業。更新作業並非對電腦說請改就改好了。除了修正錯誤之外,還要轉檔,人工修改書的網頁、好讀下個月的首頁及更新預告,最後上傳至伺服器,每修正一回,就要重新作業一次。

為什麼會有錯字?

本世紀之前出版的實體書,尤其是鉛字排版的,幾乎都無電子檔。如今為何能在能在好讀或網路上覓得?這要感謝很多無名英雄花了很多的時間:按原書逐字輸入;或先用辨識軟體由原書掃描檔轉出文字,再按原書逐字核對更正。

但別驚喜的過早,在網路上覓得的電子檔,並非就等於是原書。因為不論輸入或辨識都會有錯,若未經多次和多人不斷校正,往往錯誤百出,難以卒讀。

實體書也會有錯別字,可是白紙黑字印上了,除非再版不能改。電子書雖然隨時可改,幾乎所有的網站放上了就不會再改,因而才會有好讀。

好讀版的電子書,少數是由讀友分工輸入,絕大多數是由讀友在網路上找來,邊看邊改錯製作成的《經典版》,或參照原書整理校對過,掉字缺頁均已補齊的【典藏版】。儘管品質已是網路上最好的,錯謬仍在所難免。閱讀時發現了錯別字或疑似處,請隨手記錄在紙上或文字檔,好在閱畢時提供勘誤表,造福後讀者。

大部份的輸入錯誤很容易猜解,如自已、含作、恐伯、奷細、伺侯、悄俏、兔談、驚大動地等,肉眼自動校正就跳過了。這些明顯的輸入錯誤要靠校正程式全篇搜尋修正。若同樣的錯有三處,肉眼也許只能看到一處。你能指出看到的那一處,我就可以讓我的校正程式更聰明一點,能夠找到其他兩處修正。

好讀版的電子書在放上之前,我都會用我的校正程式掃一遍。你指出的錯,若已加入我的錯別字檔,未來放上的書就不會有同樣的錯。當然校正程式再聰明也無法取代肉眼。有很多希奇古怪的錯誤,只能靠閱讀上下文,肉眼才能判斷。

不時會收到讀友寄來新製作的書,我無法逐一細讀判斷品質。其中不乏隨興製作,製作者自己都未仔細看過一遍的書,這樣的書用程式一掃,就是成篇明顯的輸入錯誤,不會上架。相對的,值得信賴的製作者,或掃不出幾個錯字的,當月就會上架。

校正程式只能把守第一關,上架的書仍然會有很多希奇古怪的錯誤。很難猜解的,若你的手邊正好有原書,或能借到原書,就最好不過了。請花一點時間核對原書,是真的輸入錯,抑或原書就錯。最有幫助的是:若你有原書,請提供掃描檔給好讀,方便日後其他讀友再勘誤時,可核對或按掃描檔重校。

若無原書可核,有時很難決定。怎麼辦?可以上網查國語辭典漢典。你多花一點時間查證,我就可以省下一點再查證的時間,為大家多做一點別的服務,如加強校正程式或改寫好讀程式。感謝!

好讀製書程式 mPDB 2.6 使用說明好讀製書程式 mPDB 2.6 使用說明

如果有看不懂的地方,不是您的電腦程度太差,而是我們沒寫清楚,或寫錯了,請隨時來信提問,方便我們修正。

mPDB26.zip [下載2011/10/22 (493K) 2015/7/8

  • 請先在PC或隨身碟上建一個 mPDB26 目錄。
  • 將下載的 mPDB26.zip 解壓縮至 mPDB26 目錄。
  • 解出的檔案只有五個:
    1. mPDB.exe
    2. 錯別字.txt (多半的錯別字是要靠肉眼及文意來判斷。錯別字表則是用於判斷肉眼容易跳過、或疏忽的。錯別字表不可能完美。mPDB所附的只是最膚淺的,方便您自行添加。)
    3. big5.txt (使用於轉出pdb檔)
    4. stylesheet.css
    5. stylesheetV.css (2012/11/14)
    6. page-template.xpgt

    後三者是在產生epub檔時,要複製至epub檔中 (您可以修改這兩個檔案)。

  • mPDB.exe 立馬可用,沒有其他囉唆的安裝程式。
  • 尚未重新撰寫說明的舊功能,請參看 mPDB 2.1 及 mPDB 2.2 的說明。
  • 使用mPDB,螢幕解析度至少要1024×768。
  • 任何文字,不論是多罕見的中文字,簡體、日文或韓文,只要在網頁或任何文書軟體上能正常顯示的,都能複製貼上 mPDB 的編輯視窗,正常顯示,並製作成書。

A1. 如何開啟好讀updb/pdb檔?

  1. 新建一個資料夾。
  2. 將updb或pdb檔放在新建的資料夾。
    (updb是Unicode,比較不會缺字。)
  3. 開啟mPDB。
  4. 按左上角〔製書設定〕。
  5. 按〔開啟〕。
  6. 會跳出〔開啟好讀製書設定檔,或好讀書檔〕視窗。
  7. 選至新建資料夾。
  8. 點選其中的updb/pdb檔,按Open。
  9. 〔擷取 …中的純文字檔?〕,按OK。資料夾中就會有 0.txt .. n.txt。編輯視窗會顯示1.txt的內容。

B1. 如何將好讀updb檔轉成epub檔?

  1. 參考A1,開啟updb檔。
  2. 按mPDB右側的〔epub〕。
  3. 〔轉成epub檔?〕,按OK。
  4. 資料夾中就會有一個epub檔,檔名是書名,和updb的檔名可能不一樣。譬如說,由55a.updb轉出的是射鵰英雄傳一.epub。

註:尚未提供epub檔的書,請下載updb檔,用上述方法轉成epub檔。

B2. 如何將好讀updb檔轉成txt檔?

  1. 參考A1,開啟updb檔。
  2. 按mPDB右側的〔txt〕。
  3. 〔轉成txt檔?〕,按OK。
  4. 資料夾中就會有一個txt檔,檔名是書名,和updb的檔名可能不一樣。譬如說,由55a.updb轉出的是射鵰英雄傳一.txt。

註:上述方法也適用pdb檔,但可能會缺字。

B3. 如何將好讀updb檔轉成prc檔?

  1. 參考A1,開啟updb檔。
  2. 按mPDB右側的〔prc〕。
  3. 〔轉成prc檔?〕,按OK。
  4. 資料夾中就會多出一個prc資料夾,其中有一堆xhtml檔,及一個opf檔。這個opf檔的檔名是書名,和updb/pdb的檔名可能不一樣。譬如說,由55a.updb轉出的是射鵰英雄傳一.opf。
  5. 按這個opf檔,就會跳出Mobipocket Creator的視窗。若未安裝Mobipocket Creator,要先下載安裝 (creator.msi, 8MB)。安裝時,請選Create Home Edition (easier to use)。
  6. 按畫面上的〔Build〕。
  7. 再按新畫面上的〔Build〕。
  8. 關閉Mobipocket Creator。
  9. prc資料夾中就會有一個prc檔,檔名是書名。

C1. 如何新增製書設定檔?

  1. 先新建一個資料夾。
  2. 開啟mPDB。
  3. 按左上角〔製書設定〕。
  4. 按〔新增〕。
  5. 〔新增製書設定檔?〕,按OK。
  6. 會跳出〔另存好讀製書設定檔〕視窗。
  7. 選至新建的資料夾。按Save。

註:

  1. 製書設定檔要有檔名,預設的檔名是updb.inf,您可以修改。
  2. 製書的基本概念是一本書一個資料夾。

C2. 如何開啟製書設定檔?

  1. 開啟mPDB
  2. 按左上角〔製書設定〕。
  3. 按〔開啟〕。
  4. 會跳出〔開啟好讀製書設定檔,或好讀書檔〕視窗。
  5. 選至書所在的資料夾。
  6. 點選其中的製書設定檔,按Open。
    (若未修改過,預設的檔名是updb.inf。)

C3. 如何儲存製書設定檔?

  1. 開啟mPDB
  2. 按左上角〔製書設定〕。
  3. 按〔儲存〕。

D1. 如何由一個文字檔快速製書?

  1. 先新建一個資料夾。
  2. 參考C1,在文字檔所在的資料夾中,新增製書設定檔。
  3. 在作者欄位,輸入作者的名稱。
  4. 在書名欄位,輸入書名。
  5. 打開文字檔並copy内容。
  6. 編輯視窗會顯示空白的1.txt。將内容貼上後,按〔儲存〕。
  7. 儲存製書設定檔,請參考C3

至此,基本工作已完成,接下來是:

  1. 如何快速切割章節?請參考E1
  2. 如何快速產生目錄?請參考E2
  3. 如何產生updb/pdb檔?請參考E3

D2. 如何逐章快速製書?

  1. 先新建一個資料夾。
  2. 參考C1,在文字檔所在的資料夾中,新增製書設定檔。
  3. 在作者欄位,輸入作者的名稱。
  4. 在書名欄位,輸入書名。
  5. 編輯視窗會顯示空白的1.txt。將内容貼上後,按〔儲存〕。
  6. 按〔新增下章〕。
  7. 編輯視窗會顯示空白的2.txt。將内容貼上後,按〔儲存〕。
  8. 之後各章,同樣方法。

至此,基本工作已完成,接下來是:

  1. 如何快速產生目錄?請參考E2
  2. 如何產生updb/pdb檔?請參考E3

E1. 如何快速切割章節?

  1. 將滑鼠游標移至切割點。
  2. 按〔分成兩章〕。

E2. 如何快速產生目錄?

  1. 在每一章的TXT檔案,把章數與標題放在第一行。
  2. 按〔產生目錄〕。
  3. mPDB會產生一個0.txt檔案。如果滿意,按〔儲存〕
  4. 如果需要修改,修改後再按〔產生目錄〕。

E3. 如何快速產生updb/pdb檔?

  1. 按〔轉成 updb〕。
  2. mPDB會產生一個〔書名〕.updb檔案。

讀友需知讀友需知

製書容易校書難

目前電子書網站相當多,幾乎都在大陸,且幾乎都是同一個原始電子檔抄來貼去,有時少貼了一些或多出幾句亂碼,品質往往愈轉抄愈差,有的不知所云,有的甚難下嚥。讓人心動又心痛。高品質的電子書,真是難找。

上這些網站還得小心那些有色廣告,和跳出來要您下載的程式。儘管如此,我們仍得感謝這些網站,沒有它們,就連最低品質的電子書,也找不到。

網路上的電子書雖然成千上萬,但說真的,並非神奇到所有的書都能找到電子檔。有些書從來就沒人建過電子檔,或者曾有過但已失蹤。偶爾有讀友來信,希望我們能放某某作家某某書,可是若在網路上完全找不到該書的電子檔,我們也生不出來,真是抱歉。

新書、無名作家、或不太為人所知的書,是不太可能有電子檔的。畢竟,要將一本書重新輸入或掃描成電子檔,沒幾個人有原書,有時間,或願意這樣做。因而大陸過去這些年,對電子書的貢獻是令人感激的。許多絕版,或被人所遺忘的好書,在網路上仍然留傳著,品質差沒關係,至少還有化腐朽為神奇的機會,稍加整理校對,仍可一睹,只要您不過分吹毛求疵的話。

好讀的定位

好讀是讀友協力清理正體中文電子書的平台。站上所有的書,都可免費在線上,或下載完整閱讀。若您需要純文字檔,也很簡單,使用好讀製書程式mPDB就可由下載的書檔轉出。

好讀提供您的是方便的閱讀環境,想要閱讀,卻苦於手邊無書可看的時候,請隨時再來好讀瀏覽,也許就可找到幾本未曾見過或想重看的好書。忘了好讀的網址,別煩惱,只要用Google搜尋好讀兩個字,第一個搜尋結果就是好讀。

好讀電子書的版本類別

好讀電子書,依來源及校正的程度,與原書會有些微或很大的差異。為了便於區分,分為三類,要靠讀友不斷勘誤校正才能越來越好:

【分工輸入版】品質最好,是由眾讀友按掃描檔,分工輸入的。

【典藏版】由原作者提供,或參照原書整理校對過,掉字缺頁均已補齊。當然錯謬仍在所難免,看到錯別字,請不吝指正,造福後讀者。

《經典版》品質算好,雖無原書可參照,但至少整理校正過一遍,不但排版調整過,標點符號、常見的錯別字也多半改過,但因無原書可參照,若原始電子檔掉字缺頁,經典版也從缺。

電子書的優點是隨時能更新。為了便於區分更新的日期,好讀電子書的首頁特別註明製作的日期,如《二○一五年三月六日版》。同一本書,日期越新的,品質越好。下載閱讀或勘誤,請使用站上的最新版本。

站上的書是每月的第一個星期五正式更新。若註明的日期超前,並非打錯,而是更新預告,提前放上的新書或已再修正的版本。

為何為沒有這本書?可否增加那本書?

好讀不是出版社,站上的每一本電子書多半是讀友依個人的興趣,花了很多的時間,整理校正出來與大家分享的。因為費時費事,無法量產。

沒有的書,一是截至目前為止,無人有興趣整理製作;二是有人製作過,但品質太差,不值得放;三是網上查無現成的文字檔,無法加工整理校正;四是沒見過原書,也無原書掃描檔。若您能提供原書掃描檔,方便建檔校正,上架的機率會提高。

閱讀時,發現錯別字,可以改嗎?

若大家各改各的,很難確認哪一個版本是最好的。每個人看到的錯別字也有異,最好的版本要靠大家的眼睛一起來除錯,才能讓每本書的品質越來越好。發現錯別字,請按這裡

很多世界名著,有譯者版本學,讀者會認真比較不同譯者譯筆之流暢與否,不知道讀友在下載書時,能否得知好讀版參考的是哪一個譯者翻譯的版本呢?

電子書製作不易,高品質的世界名著電子書非常少,無法卒讀的好讀也不會放。典藏版,讀友參照原書再整理校正過的,多半是有標明譯者,或上網就可查得到。經典版,多半是讀友自對岸找來的簡體檔,邊看邊改,再整理製作成的正體版。原始檔一般說來,品質甚差,也難知譯者是誰。好讀版經讀友陸續校正勘誤,只能說可讀性較高。要講究譯者版本學,只有一途:購買中外文版原書比對。

電子書是製作者手打的嗎?為何有些電子書會打出這麼多錯字?

站上的電子書原先多半無文字檔,是由後人輸入,多半不是製作者。譬如說,司馬翎的《帝疆爭雄記》乙書超過八十萬字,手打要多少天?二十天?會有人肯花二十天手打這本書嗎?比較可能是大陸有人將原書OCR成簡體文字,置於網上。OCR的辨識率不可能100%,需要人工再整理校正。但大陸會有人再按原書逐字核對嗎?當然不太可能。

正確率90% = 八萬個錯字 (未校,算好的)
正確率99% = 八千個錯字 (一校)
正確率99.9% = 八百個錯字 (二校)
正確率99.99% = 八十個錯字 (三校) (換一個人校可減少盲點。)

等不及的書,自己動手製作比較快

實際上,好讀轉檔程式mPDB很容易使用,您自己製作一本就知道了。困難之處是大部份的人,能有時間看書就不錯了,想到要花時間,自己製作一本給自己看,就難了,要邊看邊停下來改錯,那就更加難了!現成的還是方便。可是若每位讀友,這一生,只要能精心製作一本高水準的愛書,與大家分享,每個人可選擇的現成方便,就多了,未來的讀友就更加有福了。

有緣來好讀

好讀這十幾年來的演變,大部份是緣自和讀友們互動的結果,並沒有什麼先知灼見的藍圖可依據。好讀也不做任何的廣告,日益增加的讀友,有些是經人推薦,有些是不小心自己找上門來的。大概就是俗話說的,有緣千里來相會,無緣對面不相逢。

讀友遍及全球一百四十多個國家。較難以思議的是,其中60%以上居然是習於簡體的大陸,而原本佔多數的台灣僅佔20%左右了。是台灣的讀友變少了嗎?當然不是。是大陸的讀友越來越多,以人數算已是台灣的三倍,幾個月前只有二倍。

好讀的期望

文化資產有其時代或地源之特性和立場,好讀收藏之各類書籍和文章留言內容廣泛,各種立場看法都有,但只代表各作者或讀友本身之意見,並不代表好讀之立場。

好讀於2001年9月3日正式上線,是有了網路,有了電子閱讀器,才有好讀。好讀的原意只是帶頭整理製作一些電子書,讓大家試試手執閱讀器的樂趣。當然百年前,清末民初左右的書,最無版權爭議。困難處是這類的書籍網路上很難找到,又半文言半白話,缺字無法補,錯字又沒有原書可核對,就是辛苦輸入整理出來,也沒有幾個人要看。

即使如此,好讀也不隨便放書。放的多半是絕版或早期紙本印刷的好書,由讀友,花了十天至一個月以上的時間,辛苦整理校正出來的版本,有些難免有版權爭議,好讀是扛了不少責任,也被找上過一些麻煩。實際上,版權是保護作家的收入,若已絕版,就無收入可言,要講侵權,要看誰在說,和怎麼看待這個問題。沒人買得到,看的人也越來越少,才是作家的損失。一本慘澹無光、過時過氣、乏人問津的書,能再亮麗重新出現在網路上並保留下來,好讀是功是過,自有公理。

兩岸分離之後的三四十年,大陸文化開了天窗,港台則文藝再復興,尤以武俠小說更是獨具一格。可悲的是這段時代的好書不是絕版了,就是難以再覓得;令人驚喜的是在大陸的電子書網站居然可找以到許多簡體電子檔,真是文化的救星。目前手執閱讀器流行了,若您不是從事中文研究,想看的不是古典中文作品,或許能在好讀找到這段時期的一些令您懷念的老書。

由於好讀的鍥而不捨,才會有像嘉明這樣的讀友,整理出這麼多高品質的武俠小說。希望經過更多讀友的努力,好讀能累積更多的文化資產,不但讓世界各地的今人,也讓五十年、一百年之後的未來人也都能隨時隨地再欣賞。

好讀 uPDB (Unicode) 及 PDB (Big5) 檔規格好讀 uPDB (Unicode) 及 PDB (Big5) 檔規格

機子及作業系統越來越多,我不可能逐一撰寫閱讀軟體,因而特將uPDB及PDB檔詳細規格公布如下,方便有興趣、有時間、能寫程式的讀友,為新機種撰寫閱讀軟體。

  • PDB是源自Palm作業系統的一個單一檔案,簡易資料庫。
  • 每一個PDB檔含N筆不定長度的資料(record)。
  • PDB檔最前面當然要有個Header,定義本資料庫的特性。
  • 因資料長度非固定,無法計算位置。所以Header之後,是各筆資料所在的位置,可以用來讀資料及計算每筆資料的長度。
  • 之後,就是一筆一筆的資料,沒什麼大學問可言。
  • 檔案的前78個bytes,是Header[0..77]:
    • Header[0..34]舊版是放書名,新版是放作者。可以不理。
    • Header[35]是2,舊版是1。可以不理。
    • Header[36..43]是為Palm而加的兩個日期,可以不理。
    • Header[44..59]都是0。可以不理。
    • Header[60..63]是”BOOK”。可以不理。
    • Header[64..67]是判別的關鍵,PDB是”MTIT”,uPDB是”MTIU”。
    • Header[68..75]都是0。可以不理。
    • Header[76..77]是record數 = N (章數) 加2 (目錄及書籤)。
  • 每筆資料的起始位置及屬性,依Palm的規格是8個bytes,前4個bytes是位置,後4個bytes是0。一共有 (N+2) * 8 bytes。
  • 第一筆資料定義書的屬性,是8個空白字元、書名、章數及目錄:
    • (PDB檔)
      8個空白btyes,可以不理;
      之後接書名是Big5碼,後接三個ESC(即27);
      之後接章數(ASCII string),後接一個ESC;
      之後接目錄,各章之標題是以ESC分隔。
    • (uPDB檔)
      8個空白btyes,可以不理;
      之後接書名是Unicode碼,後接三個ESC(即27,0);
      之後接章數(ASCII string),後接一個ESC (27, 0);
      之後接目錄,各章之標題是以CR(13,0) NL(10,0) 分隔。
  • 再來是N筆資料,每筆是一章的內容,PDB檔是Big5碼(是null-terminated string,最後一個byte是0),uPDB檔是Unicode碼。
  • 第N+2筆資料是書籤,預設是-1。可以不理。