💉涵涵貓
3 weeks ago
想說做CBC教案想叫AI生成經典某個疾病的血片照片可不可行,然後google AI studio給我這個
https://images.plurk.com/4ZkwhDyFJkwhQqKjCnRul4.png
大概需要非常精細的prompt才可以辦到吧www
latest #155
💉涵涵貓
3 weeks ago
這血怕不是從外星人身上抽出來的www
我需要人類的血做成的推片啦
💉涵涵貓
3 weeks ago
我也沒有要他在圖片裡面放中文字
只要圖片就好了啦www
我不需要外星文字謝謝
大概是因為我都用中文跟他講話所以他覺得生成的圖片裡面也要放中文(?
指令應該仔細一點的
berrycat
3 weeks ago
哇~~
立即下載
血片讓ai憑空生成感覺有點難? 可能要給樣本讓它圖生圖 (gemini-nano bana)?
可能一般ai不會訓練這個
💉涵涵貓
3 weeks ago
painocat: 我本來是只想叫它生個正常人的血片來看看,如果可以的話本來想再叫它生什麼CML或AML之類的血片,或是骨髓拉片,看來還遠著呢
ssttaarrtt7616274: 說的也是www
可是在我完全沒有給它任何圖片的情況下,它可以生成這種程度我覺得已經值得讚賞了它連我們在顯微鏡下面看片的視角都有模擬出來耶(就是4個角有黑黑的,因為顯微鏡鏡頭看下去視野是圓形的)
目前可能直接去撈教科書裡面的照片還是比自己訓練AI快www
💉涵涵貓
3 weeks ago
不過今天打開google AI studio主要不是生成教案,這個試好玩ㄉ而已
我是想要它幫我做個免網路免安裝的exe小程式,讓我可以帶到醫院上班用
💉涵涵貓
3 weeks ago
因為我覺得這裡現行的作業方式太沒效率了
每天要查未簽收檢體,LIS(實驗室資訊系統)可以將查詢結果匯出為pdf檔,但是因為是掃描型pdf,也就是每一頁其實都是一張圖片的概念,裡面的文字是不能選取然後複製的
💉涵涵貓
3 weeks ago
所以呢目前就是人工一頁一頁用眼睛看,看到該頁有列出我們負責的檢體的話,就把該頁紙本列印出來
全部印出後,用HIS系統(醫院資訊系統)搜尋檢體編號,看那隻沒有被簽收的檢體到底去哪裡,或是病人根本沒有來醫院抽血/留尿/留大便
有夠白癡的,我們檢體編號有夠長,10幾碼吧
然後要看著紙本,在電腦上手動自己輸入搜尋列裡面
💉涵涵貓
3 weeks ago
我打字算快啦也沒有老花眼,我可以查很快
但有時候當天有外出一場破百人或是院內週年慶病人很多,那個LIS匯出的檔案有二三十頁
💉涵涵貓
3 weeks ago
一頁一頁人工慢慢看很容易漏而且速度超慢(o
💉涵涵貓
3 weeks ago
才想要搞個小程式是可以匯入pdf檔案,用光學辨識的方法去抓取我們要找的關鍵字,然後列出該行的文字,供我們選取複製,去HIS那邊貼上
💉涵涵貓
3 weeks ago
在我來這裡上班之前他們好多作業流程都用非常土法煉鋼的方式真的是讓我目瞪口呆(o
💉涵涵貓
3 weeks ago
很不方便的地方都沒有人想搞得方便一點嗎??
可是不得不說以醫中的等級來看這裡的IT部門真的爛到出水,電話很難打就算了,常常打了電話請他們處理,他們還是不能解決問題,現在才體會到我前東家的工程師有多猛
💉涵涵貓
3 weeks ago
喔對,我用google AI studio失敗ㄌ,它寫的code跑不了
後來開男友付費的Chatgpt帳號來用,有寫出能跑的東西,也有成功打包成exe檔
果然發動新台幣的力量還是比較厲害嗎?
明天上班帶去試試看🤔
💉涵涵貓
3 weeks ago
我希望我離職之後我留下來的東西還是可以正常運轉
資安部門(有這部門嗎)不管你們在公用電腦裝什麼軟體嗎?
💉涵涵貓
3 weeks ago
ssttaarrtt7616274: 我做的是exe不用安裝,他們應該管不到我(?
之前學長姊抱怨電腦跑太慢,我也弄了一個清理快取+刪除資源回收桶的小東西(用記事本貼上code然後存成bat檔),每台電腦都放一個,雙擊就自動會跑,IT也沒發現
💉涵涵貓
3 weeks ago
我們電腦有禁止私下安裝程式啊,之前也說不可以裝電腦版Line
💉涵涵貓
3 weeks ago
很多人就也在那邊抱怨這樣傳東西很麻煩
所以我就用chrome擴充功能裝了網頁版的line
💉涵涵貓
3 weeks ago
我覺得我們IT應該是沒有閒功夫全院在那邊慢慢抓啦,聽其他學長姊靠北說之前連拜託他們處理印表機連線問題他們也是死活不願意過來看,遠端操控處理不了就兩手一攤說沒辦法
💉涵涵貓
3 weeks ago
我也不知道我們IT的資安到底是在做什麼
我們單位以前有擺一些簡單的機器,所以有一台電腦是儀器的server
後來被整併掉儀器都搬走了,但是server裡面跟儀器的連線程式還在
💉涵涵貓
3 weeks ago
那台當server的電腦非常老了,他還是win 7
x光室的更老是xp
反正老電腦就是東西越來越多,以前的人也從來沒有淘汰掉用不到或是廢棄的程式,它已經滿到要正常運作都有問題了
IT今年其實有在催各單位電腦要換新,但是這一台當server的主機小leader一直說不可以換,萬一實驗室回歸我們這裡了還需要它
💉涵涵貓
3 weeks ago
小leader打給資訊室,結果他們看一看就說ㄛ抱歉他們不清楚跟我們儀器的連線問題我們應該要叫廠商來處理,不然就是乖乖聽他們的話把主機換掉
💉涵涵貓
3 weeks ago
有一天病人比較少我就在那邊慢慢清
翻到一個一直在變肥的資料夾,阿幹就是這個東西一直增值電腦才超級滿
原來是舊儀器程式的自動備份原始資料,病人姓名、病歷號碼、檢體位置、檢體編號etc.
儀器早就撤掉了,可是它還是一直在存這些它根本已經用不到的資料
然後裡面還可以撈到醫檢師發報告系統的帳號和密碼,就是可以修改密碼的後台,這個程式裡面還有路徑
💉涵涵貓
3 weeks ago
我不覺得這樣資安有做到多好欸(
💉涵涵貓
3 weeks ago
所以如果有人有心想搞怪其實可以查到他們的帳密跟一些病人的個資欸,這樣超不安全的好ㄇ...
💉涵涵貓
3 weeks ago
IT都不管啊反正啥事都是叫我們叫廠商,他們都不在乎資安了我管他媽的那我要追求上班方便
💉涵涵貓
3 weeks ago
我一個算時薪的打工仔只在乎可以不用加班跟減少工作量
醫院十之八九給IT薪資開的很爛,請不了更好的
欸 不是有評鑑嗎 (也不清楚會不會看這種)
💉涵涵貓
3 weeks ago
ssttaarrtt7616274: 醫院開給行政的薪資簡直就是歧視,確實也不能要求人家要有多少產值…流動性很高
評鑑好像不太看這個,沒聽說欸🤔
因為評鑑委員本身也是醫生或醫事工作者,他們應該不會去想到資訊那一塊吧
不過最近在推智慧醫院,看看未來會不會改善
💉涵涵貓
3 weeks ago
而且評鑑就是演一場大戲啊
我自己有用ai studio嘗試做一個能ocr的,用python的函式庫作
💉涵涵貓
3 weeks ago
dx90c: 我也是用python做的,不過現在好像已經不是OCR的問題了
是打包有問題
💉涵涵貓
3 weeks ago
本來今天想試著處理,但是同事暈倒了(o)所以我們對調工作崗位,今天我是外面跑的那個,ㄅ是在實驗室裡面的
💉涵涵貓
3 weeks ago
啊不過同事覺得還好反正這些年來他們都這樣過了,不方便的好像也不方便習慣了
好ㄛ
💉涵涵貓
3 weeks ago
一定是工作太累才會突然暈倒啦ㄍ
因為平常的時候python會自己抓函式庫,所以打包成exe是一個大工程
打包成exe真的很容易有神奇的問題
💉涵涵貓
3 weeks ago
dx90c: 啊...原來如此,感謝分享
窩本來連python都不知道是什麼東東...就是之前沒用過studio這支ai想說設定個目標(?)來用用看,平常讀書沒用過這個
💉涵涵貓
3 weeks ago
ssttaarrtt7616274: 反正這本來也不是我的工作,只是想做個嘗試而已
如果失敗了也不會怎樣啦,就當作認識新ai而已(o
會長期在這邊工作的人都不在乎了,我也沒有必要鑽牛角尖
💉涵涵貓
3 weeks ago
看看明天病人多不多x如果沒有太忙也許可以再繼續摸魚摸摸看
你可以這樣做,叫ai把所有用到的函式庫都給你,然後讓他生成打包代碼
exe是獨立的環境,所以你打包完後直接開啟就會和你醫院裡面的環境一樣了
py打包成exe有輔助工具可用,不過直接問ai會比較快
💉涵涵貓
3 weeks ago
dx90c: 好的好的,謝謝太太!到時候試試看
或者你也可以直接把py腳本丟上來大家一起打包看看www
💉涵涵貓
3 weeks ago
dx90c: ?我怎麼沒想到www
💉涵涵貓
3 weeks ago
在我自己的電腦是可以跑但是去醫院我不知道(o
💉涵涵貓
3 weeks ago
還有一個bat是gpt寫來打包用的
醫院電腦有在c槽裝那個ocr軟體了嗎
💉涵涵貓
3 weeks ago
ssttaarrtt7616274: 不能裝
醫院電腦是不能自行安裝任何軟體的,我也沒有更動c槽的權限
💉涵涵貓
3 weeks ago
C槽只供檢視
我下班回去包看看
雅薰❤素亞娜
3 weeks ago @Edit 3 weeks ago
看code,有寫預設OCR軟體裝哪裡路徑 (我應該沒理解錯?)
https://images.plurk.com/sPhqs2el8wXNDuSHHrzWv.png
💉涵涵貓
3 weeks ago
我知道那是寫軟體裝哪裡
但窩的問題是不可以安裝任何東西qq
醫院怕有人會亂搞電腦所以(
阿這個也要一起在打包的時候包進去
💉涵涵貓
3 weeks ago
不過我還沒確認c槽以外的地方能不能動
💉涵涵貓
3 weeks ago
突然想到
OCR是一頁一頁去掃的話
如果檔案很多頁(20~30頁)不曉得會不會跑很久(醫院的電腦跑得有點慢)
如果程式跑得速度比我自己人工看還慢,做這件事就沒有意義
我們也是有淡旺季之分
💉涵涵貓
3 weeks ago
(我也是不懂還不到一年才剛新換的主機為什麼沒快幾天就慢下來了
OCR就看電腦的硬體能力,反正應該要比人快
💉涵涵貓
3 weeks ago
因為今天光是要點開目前的EXE檔就有點慢了
不知道如果能跑,跑起來會不會很久
都開起來了但還沒實驗就發生同事暈倒事件後來就趕著回崗位
exe檔案因為你打包起來,所以他第一次要展開比較久
我最近做的是把畫作報名表給ocr成csv表格,基本沒錯誤,除了逗號被csv誤認為換格子外
💉涵涵貓
3 weeks ago
soga我的確是只點開了那唯一的一次,不知道未來如果再開會不會也那麼久
我的OCR辨識目前看起來是也抓得到我需要的編號,其實本身要抓的PDF格式很單純,沒有表格也沒有任何標點符號,全部都是整行的
我修正了一下打包的模式,然後修正了你兩個外部程式的資料夾路徑,你自己看說明照著放應該可以
💉涵涵貓
3 weeks ago
dx90c: 哇謝謝太太
只是這個連結點不開耶
💉涵涵貓
3 weeks ago
今天沒背自己的電腦來醫院,沒有python可以用,失策
草www
https://images.plurk.com/3dUjZTdY0Koi6GzyloAdeR.png
💉涵涵貓
3 weeks ago
dx90c: 這個可以下載了!
但我不能在電腦裡面安裝Tesseract和poppler😂
💉涵涵貓
3 weeks ago
什麼軟體都不能安裝
💉涵涵貓
3 weeks ago
有鎖權限×
https://images.plurk.com/4GITked7VkfW0Dl6QJANNl.jpg
我昨天也卡在Tesseract好像一定得安裝? (沒找到可攜版),poppler好像不用安裝解壓縮就行

不知道怎麼辦,我只想到可以換一家離線ocr,例如PaddleOCR (他基本ocr功能可能能打包進去)
💉涵涵貓
3 weeks ago
對兩位真不好意思😂😂
💉涵涵貓
3 weeks ago
我如果要繼續try也要等到禮拜四下午了
明天上午跑巡檢下午要去上學
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
喔,我那邊AI是說先在家裡安裝好Tesseract,把Tesseract檔案挪過去看能不能跑www
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
ssttaarrtt7616274: 這個我之前有試過是python自己的EASYOCRGitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+...效果稍差但也不是不能用[OCR][Python]測試tesseract與easyOCR誰比較準跟快
💉涵涵貓
3 weeks ago
dx90c: 我就是在自己的電腦安裝過,gpt也是說理論上可以一起打包進去
但要是真的跑了就會出現這個
https://images.plurk.com/2PKkWGV07c08H0kLaN8nPZ.jpg
感覺還是沒有包進去R不然這個exe怎麼還是想去C槽找Tesseract
當初就已經一直跟GPT和studio強調我的環境就是*C槽沒有更動的權限也不可以安裝任何軟體
好ㄛ他們聽不懂ㄇ
💉涵涵貓
3 weeks ago
喔對了我們的電腦有夠慢
剛才計時了一下
點開目前這個不能用的exe要花到18秒
什麼都還沒做ㄛ只是點開出現那個介面而已
💉涵涵貓
3 weeks ago
平常開LIS也大概要30秒ㄅ,有時候更慢
不懂明明是不到一年的新主機為啥性能極低
拔隨身碟也要等
不要打包進去
💉涵涵貓
3 weeks ago
dx90c: 不包OCR工具進去?可是電腦是不能連上外網的欸
我的作法是,只打包主程式,並留下exe位置告訴python腳本說要去隔壁資料夾拿exe
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
你到時候應該是拿隨身碟直接上醫院電腦,
那你Tesseract、poppler資料先都複製進入對應資料夾,測試的時候就隨便找台電腦去試看看沒裝過的電腦能不能直接開

我目前是用執行檔+資料夾形式,不是打包成單檔
根目錄
├python打包好的exe和他的執行資料夾
├Tesseract
└poppler
💉涵涵貓
3 weeks ago
目前情況是這樣
https://images.plurk.com/2MAeaM0hyx1LXuscEVf7GF.jpg
我研究一下
💉涵涵貓
3 weeks ago
dx90c: 呃呃其實您忙您的沒關係,讓兩位花時間在非必要也沒有酬勞的事情上面窩很不好意思
沒事,單純我指令沒下好,沒包到那個函式
https://images.plurk.com/1prthxDb8NFkUvT9dx3rdZ.png
長這樣對吧?
https://images.plurk.com/2bYJryXHtVzS01O8hYHRM2.png26.23 MB file on MEGA剩下的你照使用說明.txt去放,總之現在暫時會動了XD
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
ssttaarrtt7616274: 因為可以從git編譯Tesseract,總之照玄學上講應該是能夠先在A電腦裝完之後把整個資料夾摳進隨身碟裡面還能動的,具體怎樣我沒試過XD
Compilation guide for various platforms
💉涵涵貓
3 weeks ago
dx90c: (剛才來一波病人×
會動而且是快速的,太厲害了
https://images.plurk.com/7vTusXxCOG26CurSVoyvCI.jpg
不過這是不能載入中文的意思?可是我確定我照著放進去的東西裡面有含繁中語言包🤔
https://images.plurk.com/5SKStGazwlFtRuhnqMwOfL.jpg
我從LIS匯出的pdf裡面也的確含我預設關鍵字的內容,而且是清晰的
https://images.plurk.com/1HOl3FS2HYvQ2g3H9uCsZF.jpg
這台電腦沒有連外網所以也沒有line截圖可以用×只能手機拍照×
你腳本沒寫怎麼找字典w
💉涵涵貓
3 weeks ago
dx90c: 我得等下班回去用自己的電腦了×
我改一版給你等我上傳
錯誤原因的簡單解釋
您的程式成功找到了 tesseract.exe 並且執行了它。 這證明我們的路徑設定是正確的。
但是,被呼叫的 tesseract.exe 自己,卻找不到它的「字典」 (也就是存放 chi_tra.traineddata 繁體中文語言包的 tessdata 資料夾)。

解決方案:在呼叫 Tesseract 時明確告訴它「字典」在哪裡
解決方法非常簡單,我們只需要修改一行程式碼,在呼叫 tesseract.exe 的指令中,多加一個參數,明確地把 tessdata 資料夾的路徑告訴它。
💉涵涵貓
3 weeks ago
dx90c: https://images.plurk.com/RMRZpqLGAHVr6os3vAR4S.jpg
有方向跟別人不一樣的斜槓(?)欸
💉涵涵貓
3 weeks ago
我前天亂試的時候好像也有發生一樣的事,但不知道跟路徑裡面有左斜右斜有沒有關係🤔
先用純英文路徑
那個斜線在python比較沒關係
💉涵涵貓
3 weeks ago
好像不是純英文路徑的問題🤔
https://images.plurk.com/4jmqFLn3eHR7wisScGv1RL.jpg
跟之前的錯誤訊息是相同的吧
少了一層嗎,我調整一下
試作 改成easyocr版的(模型都在裡面)
只要雙擊exe就行
但總覺得ocr速度不快

google雲端

備用 mega雲端
我要相信這版本能成功 26.23 MB file on MEGA
💉涵涵貓
3 weeks ago
dx90c: https://images.plurk.com/5maKZRIS1LODSt1RKfcf2G.png https://images.plurk.com/7k9J9mjipE5UxfN5sT8Dpe.png https://images.plurk.com/4ZmKeRXWCQNhSVsqitOjRv.png
隨身碟裡面帶走的內容物跟我自己電腦下載的應該是都一樣才對
(截圖截不下就只截到上面)
下一回合測試我要等禮拜四ㄌ...
我現在在測試easyocr那版XD
mtyukan: 這個應該就是了,之前寫的時候AI自己那邊猜錯路徑所以少了一層資料夾,但是我相信v6版本他應該處理了
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
ssttaarrtt7616274: 你這版我成功了,但是我這台電腦太差沒顯卡跑了半小時
https://images.plurk.com/3mgfqHUUNfzd2bIUIzqkyB.png
https://images.plurk.com/6slsCMW3sZHdNpo2Iz1l5w.png
💉涵涵貓
3 weeks ago
這個很吃顯卡嗎
我自己的電腦是有獨顯但是工作的電腦有點爛
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
mtyukan: 你如果能用 Tesseract 我相信不會差太多(思
我這台是14年前的文書機(i5-4代)
所以我才沒去裝Tesseract只是模擬路徑(找藉口
雅薰❤素亞娜
3 weeks ago @Edit 3 weeks ago
mtyukan: ocr我有預設使用cpu,電腦也沒顯卡(CPU:i5-4570 桌機)
一個4頁pdf花了2分49秒 https://images.plurk.com/7piQ4aU3PnDCnCHrGIl4l5.png

我發覺 他如果圖太糊辨識能力不好
💉涵涵貓
3 weeks ago
14年
我們的電腦是很新啦,我沒去看它的cpu,但是今年年初買的,win11
它就,慢慢的,但應該是可以跑啦😂
💉涵涵貓
3 weeks ago
我應該不會遇到解析度的問題,匯出的檔案非常清晰
ㄜ不過我是用自己的電腦跑最初還沒打包過的py測可以,打包後就打咩#
💉涵涵貓
3 weeks ago
在打包前都很美好(o
💉涵涵貓
3 weeks ago
不知道我同事會不會覺得我下午不知道在幹嘛一直在插拔隨身碟一直換電腦
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
這就跟獨自出國,然後限制不能在國外買少的東西,只要行李沒打包好就強制回國才能再打包一次的哈扣遊戲
💉涵涵貓
3 weeks ago
dx90c: 這個形容wwww太貼切wwww
不能連外網又不能安裝任何東西的環境真的有夠苛刻
💉涵涵貓
3 weeks ago
突然理解為什麼每次儀器連線或是配套軟體有問題時call廠商來工程師臉都很臭ㄌ…
還好只有1個py檔,若有多個檔打包時有更多困難,卡太久會被逼著想辦法多檔合併改寫 (來自菜鳥的經驗
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
我最近寫了一個找相似圖的py,要追加新的功能就一直麵多加水水多加麵
plugin的gui改完之後要回頭去改主程式的gui,改完主程式的gui又要回去改plugin的gui
然後我已經不敢去面對打包這件事了
程式從小黑窗到打開GUI花55秒
1頁文字pdf,找三個關鍵字,花費2分56秒
https://images.plurk.com/4ARMrrIAkdCI1iE1SyrLvp.png
https://images.plurk.com/Pg5Qi2XzVZX1DErmJEjJG.png
💉涵涵貓
3 weeks ago
原來兩位都是苦主
💉涵涵貓
3 weeks ago
突然覺得就算後來在醫院沒試成功的話,好像也可以自己拿來用在撈文獻裡面的資料
硬體 https://images.plurk.com/3OiDgM63x3dL2oqfA6MRX8.png
掃27頁用31秒,不到1分鐘,辨識結果也正確https://images.plurk.com/3rEN84xQzfnoFgYTgo1x35.png
💉涵涵貓
3 weeks ago
想說壓力測試一下,丟一篇158頁鎖右鍵複製的論文進去
這超級高清的欸怎麼抓不到
https://images.plurk.com/6ku13I8flnMhhxmSe3aGdA.png
💉涵涵貓
3 weeks ago
還是因為剛好我設定了生僻詞彙(
如果那個字你可以用什麼華康娃娃體打出來,那應該就會在OCR能辨識的範圍裡面
關鍵字那個我覺得你讓AI改出個cnofig檔會比較好調整,不然每次都一個個改關鍵字其實不是很方便
💉涵涵貓
3 weeks ago
dx90c: 關鍵字我是故意預設那4個的,因為本來就是想說for上班用😅
設計可以新增/刪除是不曉得以後會不會有變動
今天提早回院內所以溜去試了一下
https://images.plurk.com/3mJJ7C0KGtdW7jYBnT5eFz.jpg
出現沒看過的錯誤訊息
💉涵涵貓
3 weeks ago
不能連外網的那台硬體是這樣
https://images.plurk.com/6XGBaZG0EOpatf65SkJZ18.jpg
💉涵涵貓
2 weeks ago
我要說個壞消息
因為之前都不是我
💉涵涵貓
2 weeks ago
做那個崗位,所以我沒用到那一台電腦
💉涵涵貓
2 weeks ago
然後今天總算是我坐那個位置,才發現它是win7 x32
我怎麼只是一個禮拜沒輪到那裡就忘記它是老到靠北一直沒換掉的主機
不然其他電腦可以跑了
💉涵涵貓
2 weeks ago
明天我又輪到其他崗位去了(
💉涵涵貓
2 weeks ago
實驗室裡面總共5個位置所以5台電腦,加上我還會輪肺功能1台、心電圖2台、ABI1台,記錯規格了(
💉涵涵貓
2 weeks ago
全部重新下載x32的python、tesseract和poppler(
💉涵涵貓
2 weeks ago
ㄍ什麼時代了為什麼還有win7
轉成exe應該不用python
終於可以跑了
💉涵涵貓
2 weeks ago
GPT說python腳本不用改,但打包的話,我自己的電腦要重裝那些×32的東西
然後我卡在找不到x32的poppler(
5點要下班了,結束這一回合
💉涵涵貓
2 weeks ago
下禮拜的班表還沒出來,但明天我是跑外面巡檢,所以下次實驗是下禮拜不知道哪一天了
💉涵涵貓
2 weeks ago
謝謝兩位陪我研究怎麼在工作中找偷懶的方法
我還沒放棄#
氣死好不甘心喔(
mtyukan: 我用了 ssttaarrtt7616274 大大提供的版本,新增了兩項功能
1.關鍵字config,現在程式會自動生成json檔讓更換關鍵字變得更方便
2.圖像PDF上追加透明文字,讓其可以被複製、ctrl+f搜尋(大概就是阿都比PDF pro的PDF編輯化功能)
https://images.plurk.com/GRtYShxy7A51uOjIafjUR.png https://images.plurk.com/7tNqsLakHPJx5ETCU4kClY.png599.21 MB file on MEGA
💉涵涵貓
2 weeks ago
dx90c: dx90c:好猛
可是我們的電腦是x32😂
阿這...
裡面有那個py腳本原碼,就自己搭建x32的環境重新打包吧XDD
💉涵涵貓
2 weeks ago
dx90c: 知道原理但是一直卡在打包,然後就廢到現在
雅薰❤素亞娜
2 weeks ago @Edit 2 weeks ago
easyocr我問2家ai 應該是轉不了32bit了(卡在PyTorch)

Tesseract-OCR 整個程式改寫 但卡在換成舊版x32(tesseract-ocr-w32-5.3.0.)的搭配同版語言庫 結果辨識能力變差了

這年頭轉32bit這麼難嗎
💉涵涵貓
2 weeks ago
ssttaarrtt7616274: 這麼老的電腦根本不應該繼續存在
秋月霜下盼盼蟬
2 weeks ago @Edit 2 weeks ago
我這邊AI也有給我替代方案是pymupdf去替代poppler,然後一樣用tesseract ocr
雅薰❤素亞娜
2 weeks ago @Edit 2 weeks ago
dx90c: 我從easyocr改的,所以目前改tesseract版本poppler不存在

(好像沒多少有32bit的ocr引擎)
💉涵涵貓
2 weeks ago
我本來好像有看到x86的poppler,只是是中國的資源,要下載的話還要用微信或QQ登入什麼的,所以我就不敢用
AI找的其他英文論壇,的確有人提到,但是超連結也都已經失效ㄌ…感覺真的只能用別的東西來代替poppler了
舊的ocr引擎我根本不指望能用了,以前到處找ocr網站的經驗過於慘痛www
back to top