報時光是怎麼練成的報時光UDNtime 在Facebook 的評價

關於報時光是怎麼練成的，我們在網路上蒐集到這些相關的討論、資訊與評價

「報時光是怎麼練成的」的推薦目錄：

關於報時光是怎麼練成的在報時光UDNtime Facebook 的精選貼文

關於報時光是怎麼練成的在報時光UDNtime - 【第一部以籃球為主題的偶像劇】#你追過嗎... 的評價
關於報時光是怎麼練成的在報時光UDNtime - YouTube 的評價

報時光是怎麼練成的在報時光UDNtime Facebook 的精選貼文

2020-11-23 20:10:00 有 646 人按讚

#OCR #光學辨識技術 #聯合知識庫 #長達69年的報紙資料庫 #報紙數位化
#報時光是怎麼練成的

【報紙數位化】
以前做一則剪報或找一則「舊聞」，
經常要費盡千辛萬苦，也不一定能找到。
而現今只要上去知識庫就能輕鬆找到，資料查找相當方便
分享2001年聯合知識庫開站的說明，
來了解一張張歲月裡泛黃的紙本報紙，
當年是怎麼變成數位內容的。

圖說：五二○事件街頭衝突過後，警方坐於街邊看報紙
日期：1988/5/21
來源：聯合報
攝影：聯合報攝影組

#報時光UDNtime

歷史新聞

【2001-02-19/聯合報/11版/話題】

製作過程
每篇文章錯誤不到一個字

【記者李彥甫╱專題報導】如何把已經泛黃的數十年舊報紙，轉換為資訊時代可用的知識？如何把每天產生數十萬字報紙新聞有效地分類整理？即使資訊科技發展至今，仍沒有一項技術可以滿足上述需求。今天（十九日）正式上線的聯合知識庫，事實上是整合國內外多項技術，克服各項技術障礙，自行開闢了一條新途徑，才能造就最大的華文新聞資料庫。

聯合知識庫以光學辨識技術（OCR）進行報紙的整版掃描，再用圖文切割方式，將報紙版面上的內容分區切塊辨識儲存，然後再以新開發的系統進行「自動為主、人工為輔」的兩套循環校對除錯，最後在使用上輔以人工智慧資料加值與搜尋引擎技術。

在這條報紙數位化的生產線上，先透過大尺寸的數位掃描器將報紙影像掃入電腦中，後端的影像處理伺服器進行去除影像雜訊，接著切割報紙標題與內文區塊，校對版面，並逐版把切割完成的報紙影像登入資料庫中。文字條稿影像登入資料庫後，接著將依照定做的文字辨識核心進行辨識，此階段的正確率可以達到百分之九十八以上。

不過，新聞內文的部分可以直接登入資料庫，但標題的部分卻需要人工輸入。這是因為報紙標題的欄位、字體、字形非常多元化，電腦畢竟不夠聰明到可以辨識如此複雜的變化，利用人工輸入反而快速而省事。下一步則是困難度甚高的「校對」，全景軟體公司提供了「集字校對工具」，將辨識出的相同文字排列，進行電腦自動比對，約可過濾出百分之二辨識上有疑問的文字及符號，然後進行人工確認，此階段的正確率約百分之九十八點八八。接著再使用切字及難字校對，完成後的正確率約為百分之九十九點六二。但是這樣還不夠，必須進行下一個程序的校對─「逐字校對」 (整篇校對 )，但所謂「逐字」，並非重新校對所有的字，而是校對電腦挑選出來的可疑字。

經過兩套循環的校對除錯，聯合知識庫內容與原報紙內容相比，正確率已可達到百分之九十九點九一。一般而言，見報文章平均字數約七百字，也就是說，聯合知識庫的內容基本上已可做到「每篇文章錯不到一個字」的精準度。

Tags: 報時光是怎麼練成的 OCR 光學辨識技術聯合知識庫長達69年的報紙資料庫報紙數位化報時光UDNtime

報時光UDNtime

About author

翻閱老報，就像領到穿越時代的入場券濃縮了時間，我們得到更寬廣的視野它亦是舊時代的臉書也見證了美好時代文創產業的好實力報時光，為您剪輯老報精粹歡迎按讚，一同來訂閱

翻閱老報，就像領到穿越時代的入場券濃縮了時間，我們得到更寬廣的視野它亦是舊時代的臉書也見證了美好時代文創產業的好實力報時光，為您剪輯老報精粹歡迎按讚，一同來訂閱 #udn

社群媒體上有些相關的討論：

報時光是怎麼練成的在報時光UDNtime - 【第一部以籃球為主題的偶像劇】#你追過嗎... 的推薦與評價

2020年4月13日 — 三立去年以美女牌打響首部自製偶像劇「薰衣草」，今夏則力推主打「帥哥牌」的「MVP情人」，因為同樣是球員出身，四個大男生聚在一起特別有話聊，183公分高 ... ... <看更多>

報時光是怎麼練成的在報時光UDNtime - YouTube 的推薦與評價

... <看更多>

你可能也想看看

2021年10月4日 — 大家好，我們是期望以創意能量，傳遞今昔時光的溫度與美好的團隊-報時光。翻閱老報，就像領到穿越時代的入場券，時光迴留。

#2. 報時光UDNtime - 【第一部以籃球為主題的偶像劇】#你追過嗎...

2020年4月13日 — 三立去年以美女牌打響首部自製偶像劇「薰衣草」，今夏則力推主打「帥哥牌」的「MVP情人」，因為同樣是球員出身，四個大男生聚在一起特別有話聊，183公分高 ...

#3. 《浮生不若夢談傳道書6》時光沖印店（下） - 基督教論壇報

到底人生的意義為何？聖經說，是因神讓我們在其中學習謙卑和順服。「受經練」原文可譯為： ...

#4. 報時光UDNtime - YouTube

#5. 1950年代老報紙圖像化身「老派浪漫收藏章」！台灣設計團隊 ...

報時光團隊表示：「在過去，親手寫卡片、蓋上喜愛的印章圖案送給愛人朋友，是再平凡不過的事。時至今日，虛擬的貼圖與文字訊息即時且方便，那些書寫的溫度 ...

#6. 年記1960：時光的線條 - 城邦讀書花園

歐銀釧·關於年記系列由報時光與尖端出版聯合企畫，......，作者：歐銀釧，出版社：尖端，出版日期：2020-12-18. ... 時光是一本懸疑小說，誰是編劇、導演、演員。

#7. 讀創故事徵文「爸道人生學」，募集父輩親傳身授的珍藏時光

本次由聯合新聞網閱讀頻道、讀創故事發起，與協辦單位報時光，以及合作 ... 儘管成長經歷中，孩子與父親的情感交流較為疏離，但他們仍然是孩子啟蒙 ...

#8. 報時光 - 聯合知識庫

那些老派俏皮、精緻別有巧思的圖案，以及質樸幽默的廣告語彙，像是過去的人們留給現代人的生活通關密語，提醒著我們，生活可以更美好的，只要你願意更慢一點，更堅持而細膩 ...

#9. 天才棒球手大谷翔平是怎麼練成的？「九宮格目標達成法

「怪物」、「外星人」、「二刀流少年」、「貝比魯斯二世」……這些滿溢著驚奇讚嘆的綽號，統統指向同一個人——那是甫在2018年美國大聯盟球季初登板， ...

#10. 燦爛時光：Lucie的人生探索| 文學| 每週好書讀 - 中央社

台灣一代報人及世新大學創辦人成舍我的么女成露茜，在美國加州大學洛杉磯分校任教到退休，去年2010年1月去世，加州大學為她降半旗，因為她是影響社會 ...

#11. 報時光(@udn_time) • Instagram photos and videos

報時光. Society & culture website. #2023老派的生活日曆限時優惠中⚡. udntime.ctcin.bio. 復古產品在這's profile picture. 復古產品在這.

#12. 那些年，我被慈濟洗腦的歲月| CitiOrange 公民報橘

這篇文章除了回顧我那段被「靜思語」、「師公上人」洗腦的童年時光，更看看慈濟是如何用縝密的宣傳模式，將慈善、端莊、優雅的表面工夫深植人心，維護 ...

#13. 【封面人物】每首歌都能化作你的人生故事，專訪創作才子周興哲

... 聽周興哲，甚至伴隨著他的歌聲度過想家的時光，最奇妙的地方就是，無論你的處境是什麼， ... Maya 70 鉑金色羽絨外套；白色長褲，都是Moncler 。

#14. 臺南市長黃偉哲宣告河樂廣場3月7日重磅登場 - 勁報

勁報報是台灣受歡迎的新聞網站，提供即時新聞、娛樂、體育、社會、生活、副刊、國際萬象等內容，提供讀者圖像化、即時化、行動化，全面且豐富的新聞 ...

#15. 財訊-掌握趨勢、投資未來｜最懂投資的財經媒體

提供最具深度的即時財經新聞，涵蓋投資、財經、金融、科技、地產、生技、健康、政治、危老、都更主題，是台灣最資深也最權威的財經媒體。

#16. 犢犢與書的親密時光：十週年大哉問 - Readmoo

總有一天等到你（唱）～請問以下哪本經典書籍，是眾讀者心心念念敲碗終於成功敲到電子書上架？ A. 《使女的故事》. B. 《模仿犯》. C. 《原則》.

#17. 偶像和恥辱：英格蘭病入膏肓的「球星文化」是怎麼養成的？

拿索斯（Graham Le Saux）會讀《衛報》，所以顯然是同性戀。有鑑於此，可以說，英格蘭心目中理想的足球員依然建立在博比．摩爾 ...

#18. 秦关汉月 - Google 圖書結果

忽然有一天,我看到报上一条消息,说是举行了全市职工书法大赛,一等奖的获得者,是一位下岗的老工人,他几十年如一日的坚持练字,其书法艺术受到专家的好评。

#19. 近代俠義英雄傳: 近代武俠小說 - Google 圖書結果

凡是會武藝的人,在和人過堂的時候,被人打敗了,總是說這幾句話,用意是說我此刻 ... 也有三年之后,果練成了驚人的本領,真來報了仇恨的,然拿這幾句套話,遮掩顏面的居多。

#20. 小说月报．原创版2019年11月_NO．145 - 第 139 頁 - Google 圖書結果

小说月报原创版编辑部. 花。爱情不仅美好,而且还能产生出强大的力量,正因为如此,才使我的大学时光过得无比灿烂,即使遇到了生活上的困难,我也能乐观地对待。我早就说过, ...

#21. 清真鐸報（下） - 第 5 頁 - Google 圖書結果

梅林棋鞋底;阿拉伯式的性惡近於民主烟—由時进政政治聞诉-七步成那中输還排北-居川下影在大戰爆發 ... 們都是白的武遇到不關英國打敗。 ... 本期亚時時光非洲本刊」莖雌事.

#22. 七十年代 (兩卷) - 第 485 頁 - Google 圖書結果

名著,都是這個期間讀的。 ... 有人告訴我,部隊首長很器重我,說這小子行啊,去一趟北京,上一篇軍報。 ... 我們曾一起度過多少醉人的時光,談理想,談事業。她聰明,我請教, ...

#23. 去香港上大学 - Google 圖書結果

教练是一位40多岁的女士,别看讲理论时温文而雅,实战练习时像是换了一个人。刚开始上课时,大家都放不开手脚, ... 毫无疑问,在香港科大我度过了人生中最快乐的一段时光。

#24. 台灣電影變幻時:尋找台灣魂 - 第 166 頁 - Google 圖書結果

但我必須說,距離我在《紀工報》發表那篇引發不少爭議的〈《被遺忘的時光》—被遺忘 ... 到底我憑什麼以這樣一種自以為清高的姿態,去要求每一部紀錄片必須這樣或是那樣?

#25. 我意逍遥 - Google 圖書結果

嘿,沙大哥,你回来了~~~~”他涎着脸,刹时之间,高手气度尽退,仿佛又是那个贪嘴爱吃、和气胆小的小胖子了。程文栋、刘逸鳞拜见沙凌完毕,程文栋笑道:“宗主,小方他拳脚已是练 ...

#26. 让孩子读真正值得读的好文章 - 中国教育报

不少家长都想让孩子读书、多读书、爱读书、养成好读书的终身习惯，但常常 ... 李家声先生说：生命的宝贵就在于时光的宝贵，孩子的学习时光是最宝贵 ...

#27. 登峰造極籃賽》首度舉辨明星表演賽重溫中華職籃風采

台大教練曾郁嫻指出，目前球隊大部分是一般生，藉由比賽磨練球員，新的UBA球季以保住公開一級... 三立新聞網setn.com· 4 小時 ...

#28. 時光，是一種最神奇的魔法。 | 姊妹淘 - NOWnews今日新聞

(姊妹淘生活提案)如果說，時光是一種魔法，將我們帶往不同的時空中旅行；過日子的當下，唯一會讓我們幸福的理由，就是對生活的熱情。

#29. 【青報70封面故事】臺中港我國首座自力興建人工港 - 青年日報

民國65年6月出版的《奮鬥》75期，以臺中港興建工程為封面。臺中港是十大建設重要項目，也是我國自力興建的第一座人工港。民國50年代以來，臺灣經濟起飛， ...

#30. 一年中最穷开心的一天：愚人节(图) - 新浪教育

在中世纪时期，欧洲大多数国家在3月25日庆祝“圣母领报”，这一天被看作是新年的第一天。 In 1582, Pope Gregory XIII ordered a new calendar (the ...

#31. 報時光 - 博客來

【報時光】老派摩登女子鋼筆文具組. $990. 博客來首頁售票網OKAPI閱讀生活誌青春博客來 · 購物車會員分級會員專區禮物卡. 檢視:行動版電腦版 ...

#32. 報時光, 時光商號| 有.設計uDesign

報時光 | 戀戀八零明信片筆記書. NT$ 459. 單一規格 ... 報時光l 聯合報創刊號L型文件夾五組入. NT$ 250. 單一規格 ... 報時光｜老派摩登女子鋼筆文具組. NT$ 990.

#33. 煙波集團x報時光全台最老派的跨界聯名！打造懷舊老派聖誕慶典

2021年對全體國人來說是特別漫長的一年，不少人改變了原本的生活習慣，也放慢生活步調、開始學習品味生活的細節，尋找在過去追快的時間裡，我們究竟忽略了 ...

#34. 銘傳廣銷系．聯合線上《報時光》產學合作新聞圖像文創展

由銘傳大學廣告暨策略行銷學系陳柏宇主任與王皖佳老師，指導學生以「古髦人」為題，訪談台灣古物鑑賞家，由古董、古著、黑膠、老相機等題材入手，以時下青年的眼光重新定義 ...

#35. 報時光推出「時光商號」購物平台老派產品獨家優惠！ - 三立新聞

「聯合線上」旗下專注分享往昔情懷與老派生活的「報時光」，自2018年成立 ... 用心經營下，目前已是臺灣最大愛好復古氛圍及時代經典風格的交流社群， ...

關於 報時光是怎麼練成的 ，我們在網路上蒐集到這些相關的討論、資訊與評價

「報時光是怎麼練成的」的推薦目錄：

報時光是怎麼練成的 在 報時光UDNtime Facebook 的精選貼文

About author

你可能也想看看

搜尋相關連結

關於報時光是怎麼練成的，我們在網路上蒐集到這些相關的討論、資訊與評價

報時光是怎麼練成的在報時光UDNtime Facebook 的精選貼文