這血怕不是從外星人身上抽出來的www
我需要人類的血做成的推片啦
我也沒有要他在圖片裡面放中文字
只要圖片就好了啦www
我不需要外星文字謝謝

大概是因為我都用中文跟他講話所以他覺得生成的圖片裡面也要放中文(?
指令應該仔細一點的
哇~~
血片讓ai憑空生成感覺有點難? 可能要給樣本讓它圖生圖 (gemini-nano bana)?
可能一般ai不會訓練這個
painocat: 我本來是只想叫它生個正常人的血片來看看,如果可以的話本來想再叫它生什麼CML或AML之類的血片,或是骨髓拉片,看來還遠著呢
ssttaarrtt7616274: 說的也是www
可是在我完全沒有給它任何圖片的情況下,它可以生成這種程度我覺得已經值得讚賞了它連我們在顯微鏡下面看片的視角都有模擬出來耶(就是4個角有黑黑的,因為顯微鏡鏡頭看下去視野是圓形的)
目前可能直接去撈教科書裡面的照片還是比自己訓練AI快www
不過今天打開google AI studio主要不是生成教案,這個試好玩ㄉ而已
我是想要它幫我做個免網路免安裝的exe小程式,讓我可以帶到醫院上班用
因為我覺得這裡現行的作業方式太沒效率了
每天要查未簽收檢體,LIS(實驗室資訊系統)可以將查詢結果匯出為pdf檔,但是因為是掃描型pdf,也就是每一頁其實都是一張圖片的概念,裡面的文字是不能選取然後複製的
所以呢目前就是人工一頁一頁用眼睛看,看到該頁有列出我們負責的檢體的話,就把該頁紙本列印出來
全部印出後,用HIS系統(醫院資訊系統)搜尋檢體編號,看那隻沒有被簽收的檢體到底去哪裡,或是病人根本沒有來醫院抽血/留尿/留大便
有夠白癡的,我們檢體編號有夠長,10幾碼吧
然後要看著紙本,在電腦上手動自己輸入搜尋列裡面
我打字算快啦也沒有老花眼,我可以查很快
但有時候當天有外出一場破百人或是院內週年慶病人很多,那個LIS匯出的檔案有二三十頁
才想要搞個小程式是可以匯入pdf檔案,用光學辨識的方法去抓取我們要找的關鍵字,然後列出該行的文字,供我們選取複製,去HIS那邊貼上
在我來這裡上班之前他們好多作業流程都用非常土法煉鋼的方式真的是讓我目瞪口呆(o
很不方便的地方都沒有人想搞得方便一點嗎??
可是不得不說以醫中的等級來看這裡的IT部門真的爛到出水,電話很難打就算了,常常打了電話請他們處理,他們還是不能解決問題,現在才體會到我前東家的工程師有多猛
喔對,我用google AI studio失敗ㄌ,它寫的code跑不了
後來開男友付費的Chatgpt帳號來用,有寫出能跑的東西,也有成功打包成exe檔
果然發動新台幣的力量還是比較厲害嗎?
明天上班帶去試試看🤔
我希望我離職之後我留下來的東西還是可以正常運轉
資安部門(有這部門嗎)不管你們在公用電腦裝什麼軟體嗎?
ssttaarrtt7616274: 我做的是exe不用安裝,他們應該管不到我(?
之前學長姊抱怨電腦跑太慢,我也弄了一個清理快取+刪除資源回收桶的小東西(用記事本貼上code然後存成bat檔),每台電腦都放一個,雙擊就自動會跑,IT也沒發現
我們電腦有禁止私下安裝程式啊,之前也說不可以裝電腦版Line
很多人就也在那邊抱怨這樣傳東西很麻煩
所以我就用chrome擴充功能裝了網頁版的line
我覺得我們IT應該是沒有閒功夫全院在那邊慢慢抓啦,聽其他學長姊靠北說之前連拜託他們處理印表機連線問題他們也是死活不願意過來看,遠端操控處理不了就兩手一攤說沒辦法
我也不知道我們IT的資安到底是在做什麼
我們單位以前有擺一些簡單的機器,所以有一台電腦是儀器的server
後來被整併掉儀器都搬走了,但是server裡面跟儀器的連線程式還在
那台當server的電腦非常老了,他還是win 7
x光室的更老是xp
反正老電腦就是東西越來越多,以前的人也從來沒有淘汰掉用不到或是廢棄的程式,它已經滿到要正常運作都有問題了
IT今年其實有在催各單位電腦要換新,但是這一台當server的主機小leader一直說不可以換,萬一實驗室回歸我們這裡了還需要它
小leader打給資訊室,結果他們看一看就說ㄛ抱歉他們不清楚跟我們儀器的連線問題我們應該要叫廠商來處理,不然就是乖乖聽他們的話把主機換掉
有一天病人比較少我就在那邊慢慢清
翻到一個一直在變肥的資料夾,阿幹就是這個東西一直增值電腦才超級滿
原來是舊儀器程式的自動備份原始資料,病人姓名、病歷號碼、檢體位置、檢體編號etc.
儀器早就撤掉了,可是它還是一直在存這些它根本已經用不到的資料
然後裡面還可以撈到醫檢師發報告系統的帳號和密碼,就是可以修改密碼的後台,這個程式裡面還有路徑
所以如果有人有心想搞怪其實可以查到他們的帳密跟一些病人的個資欸,這樣超不安全的好ㄇ...
IT都不管啊反正啥事都是叫我們叫廠商,他們都不在乎資安了我管他媽的那我要追求上班方便
我一個算時薪的打工仔只在乎可以不用加班跟減少工作量
醫院十之八九給IT薪資開的很爛,請不了更好的
欸 不是有評鑑嗎 (也不清楚會不會看這種)
ssttaarrtt7616274:
醫院開給行政的薪資簡直就是歧視,確實也不能要求人家要有多少產值…流動性很高評鑑好像不太看這個,沒聽說欸🤔
因為評鑑委員本身也是醫生或醫事工作者,他們應該不會去想到資訊那一塊吧
不過最近在推智慧醫院,看看未來會不會改善
我自己有用ai studio嘗試做一個能ocr的,用python的函式庫作
dx90c: 我也是用python做的,不過現在好像已經不是OCR的問題了

是打包有問題
本來今天想試著處理,但是同事暈倒了(o)所以我們對調工作崗位,今天我是外面跑的那個,ㄅ是在實驗室裡面的
啊不過同事覺得還好反正這些年來他們都這樣過了,不方便的好像也不方便習慣了
好ㄛ
因為平常的時候python會自己抓函式庫,所以打包成exe是一個大工程
dx90c: 啊...原來如此,感謝分享
窩本來連python都不知道是什麼東東...就是之前沒用過studio這支ai想說設定個目標(?)來用用看,平常讀書沒用過這個
ssttaarrtt7616274: 反正這本來也不是我的工作,只是想做個嘗試而已
如果失敗了也不會怎樣啦,就當作認識新ai而已(o
會長期在這邊工作的人都不在乎了,我也沒有必要鑽牛角尖
看看明天病人多不多x如果沒有太忙也許可以再繼續摸魚摸摸看
你可以這樣做,叫ai把所有用到的函式庫都給你,然後讓他生成打包代碼
exe是獨立的環境,所以你打包完後直接開啟就會和你醫院裡面的環境一樣了
py打包成exe有輔助工具可用,不過直接問ai會比較快
或者你也可以直接把py腳本丟上來大家一起打包看看www
雅薰❤素亞娜
3 weeks ago @Edit 3 weeks ago
看code,有寫預設OCR軟體裝哪裡路徑 (我應該沒理解錯?)
我知道那是寫軟體裝哪裡
但窩的問題是不可以安裝任何東西qq
醫院怕有人會亂搞電腦所以(
不過我還沒確認c槽以外的地方能不能動
突然想到
OCR是一頁一頁去掃的話
如果檔案很多頁(20~30頁)不曉得會不會跑很久(醫院的電腦跑得有點慢)
如果程式跑得速度比我自己人工看還慢,做這件事就沒有意義

我們也是有淡旺季之分
(我也是不懂還不到一年才剛新換的主機為什麼沒快幾天就慢下來了
因為今天光是要點開目前的EXE檔就有點慢了

不知道如果能跑,跑起來會不會很久

都開起來了但還沒實驗就發生同事暈倒事件後來就趕著回崗位
exe檔案因為你打包起來,所以他第一次要展開比較久
我最近做的是把畫作報名表給ocr成csv表格,基本沒錯誤,除了逗號被csv誤認為換格子外
soga我的確是只點開了那唯一的一次,不知道未來如果再開會不會也那麼久
我的OCR辨識目前看起來是也抓得到我需要的編號,其實本身要抓的PDF格式很單純,沒有表格也沒有任何標點符號,全部都是整行的
我修正了一下打包的模式,然後修正了你兩個外部程式的資料夾路徑,你自己看說明照著放應該可以
今天沒背自己的電腦來醫院,沒有python可以用,失策
草www
dx90c: 這個可以下載了!
但我不能在電腦裡面安裝Tesseract和poppler😂
有鎖權限×
我昨天也卡在Tesseract好像一定得安裝? (沒找到可攜版),poppler好像不用安裝解壓縮就行
不知道怎麼辦,我只想到可以換一家離線ocr,例如PaddleOCR (他基本ocr功能可能能打包進去)
我如果要繼續try也要等到禮拜四下午了
明天上午跑巡檢下午要去上學
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
喔,我那邊AI是說先在家裡安裝好Tesseract,把Tesseract檔案挪過去看能不能跑www
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
dx90c: 我就是在自己的電腦安裝過,gpt也是說理論上可以一起打包進去
但要是真的跑了就會出現這個

感覺還是沒有包進去R不然這個exe怎麼還是想去C槽找Tesseract
當初就已經一直跟GPT和studio強調我的環境就是*
C槽沒有更動的權限也不可以安裝任何軟體好ㄛ他們聽不懂ㄇ
喔對了我們的電腦有夠慢
剛才計時了一下
點開目前這個不能用的exe要花到18秒
什麼都還沒做ㄛ只是點開出現那個介面而已
平常開LIS也大概要30秒ㄅ,有時候更慢
不懂明明是不到一年的新主機為啥性能極低
拔隨身碟也要等
dx90c: 不包OCR工具進去?可是電腦是不能連上外網的欸
我的作法是,只打包主程式,並留下exe位置告訴python腳本說要去隔壁資料夾拿exe
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
你到時候應該是拿隨身碟直接上醫院電腦,
那你Tesseract、poppler資料先都複製進入對應資料夾,測試的時候就隨便找台電腦去試看看沒裝過的電腦能不能直接開
我目前是用執行檔+資料夾形式,不是打包成單檔
根目錄
├python打包好的exe和他的執行資料夾
├Tesseract
└poppler
目前情況是這樣
我研究一下
dx90c: 呃呃其實您忙您的沒關係,讓兩位花時間在非必要也沒有酬勞的事情上面窩很不好意思

長這樣對吧?
dx90c: (剛才來一波病人×
會動而且是快速的,太厲害了


不過這是不能載入中文的意思?可是我確定我照著放進去的東西裡面有含繁中語言包🤔

我從LIS匯出的pdf裡面也的確含我預設關鍵字的內容,而且是清晰的

這台電腦沒有連外網所以也沒有line截圖可以用×只能手機拍照×
錯誤原因的簡單解釋
您的程式成功找到了 tesseract.exe 並且執行了它。 這證明我們的路徑設定是正確的。
但是,被呼叫的 tesseract.exe 自己,卻找不到它的「字典」 (也就是存放 chi_tra.traineddata 繁體中文語言包的 tessdata 資料夾)。
解決方案:在呼叫 Tesseract 時明確告訴它「字典」在哪裡
解決方法非常簡單,我們只需要修改一行程式碼,在呼叫 tesseract.exe 的指令中,多加一個參數,明確地把 tessdata 資料夾的路徑告訴它。
我前天亂試的時候好像也有發生一樣的事,但不知道跟路徑裡面有左斜右斜有沒有關係🤔
好像不是純英文路徑的問題🤔

跟之前的錯誤訊息是相同的吧
dx90c:

隨身碟裡面帶走的內容物跟我自己電腦下載的應該是都一樣才對
(截圖截不下就只截到上面)
下一回合測試我要等禮拜四ㄌ...
mtyukan: 這個應該就是了,之前寫的時候AI自己那邊猜錯路徑所以少了一層資料夾,但是我相信v6版本他應該處理了
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
這個很吃顯卡嗎

我自己的電腦是有獨顯但是工作的電腦
有點爛
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
mtyukan: 你如果能用 Tesseract 我相信不會差太多(思
我這台是14年前的文書機(i5-4代)
所以我才沒去裝Tesseract只是模擬路徑(找藉口
雅薰❤素亞娜
3 weeks ago @Edit 3 weeks ago
mtyukan: ocr我有預設使用cpu,電腦也沒顯卡(CPU:i5-4570 桌機)
一個4頁pdf花了2分49秒

我發覺 他如果圖太糊辨識能力不好
14年

我們的電腦是很新啦,我沒去看它的cpu,但是今年年初買的,win11
它就,慢慢的,但應該是可以跑啦😂
我應該不會遇到解析度的問題,匯出的檔案非常清晰
ㄜ不過我是用自己的電腦跑最初還沒打包過的py測可以,打包後就打咩#
不知道我同事會不會覺得我下午不知道在幹嘛一直在插拔隨身碟一直換電腦
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
這就跟獨自出國,然後限制不能在國外買少的東西,只要行李沒打包好就強制回國才能再打包一次的哈扣遊戲
dx90c: 這個形容wwww太貼切wwww
不能連外網又不能安裝任何東西的環境真的有夠苛刻
突然理解為什麼每次儀器連線或是配套軟體有問題時call廠商來工程師臉都很臭ㄌ…
還好只有1個py檔,若有多個檔打包時有更多困難,卡太久會被逼著想辦法多檔合併改寫 (來自菜鳥的經驗
秋月霜下盼盼蟬
3 weeks ago @Edit 3 weeks ago
我最近寫了一個找相似圖的py,要追加新的功能就一直麵多加水水多加麵
plugin的gui改完之後要回頭去改主程式的gui,改完主程式的gui又要回去改plugin的gui
然後我已經不敢去面對打包這件事了
程式從小黑窗到打開GUI花55秒
1頁文字pdf,找三個關鍵字,花費2分56秒

原來兩位都是苦主
突然覺得就算後來在醫院沒試成功的話,好像也可以自己拿來用在撈文獻裡面的資料
硬體

掃27頁用31秒,不到1分鐘,辨識結果也正確
想說壓力測試一下,丟一篇158頁鎖右鍵複製的論文進去
這超級高清的欸怎麼抓不到

如果那個字你可以用什麼華康娃娃體打出來,那應該就會在OCR能辨識的範圍裡面
關鍵字那個我覺得你讓AI改出個cnofig檔會比較好調整,不然每次都一個個改關鍵字其實不是很方便
dx90c: 關鍵字我是故意預設那4個的,因為本來就是想說for上班用😅
設計可以新增/刪除是不曉得以後會不會有變動
今天提早回院內所以溜去試了一下

出現沒看過的錯誤訊息
不能連外網的那台硬體是這樣
然後今天總算是我坐那個位置,才發現它是win7 x32

我怎麼只是一個禮拜沒輪到那裡就忘記它是老到靠北一直沒換掉的主機

不然其他電腦可以跑了
實驗室裡面總共5個位置所以5台電腦,加上我還會輪肺功能1台、心電圖2台、ABI1台,記錯規格了(
全部重新下載x32的python、tesseract和poppler(
終於可以跑了
GPT說python腳本不用改,但打包的話,我自己的電腦要重裝那些×32的東西
然後我卡在找不到x32的poppler(
5點要下班了,結束這一回合
下禮拜的班表還沒出來,但明天我是跑外面巡檢,所以下次實驗是下禮拜不知道哪一天了
謝謝兩位陪我研究怎麼在工作中找偷懶的方法
我還沒放棄#
氣死好不甘心喔(
阿這...
裡面有那個py腳本原碼,就自己搭建x32的環境重新打包吧XDD
dx90c:
知道原理但是一直卡在打包,然後就廢到現在
雅薰❤素亞娜
2 weeks ago @Edit 2 weeks ago
easyocr我問2家ai 應該是轉不了32bit了(卡在PyTorch)
Tesseract-OCR 整個程式改寫 但卡在換成舊版x32(tesseract-ocr-w32-5.3.0.)的搭配同版語言庫 結果辨識能力變差了

這年頭轉32bit這麼難嗎
秋月霜下盼盼蟬
2 weeks ago @Edit 2 weeks ago
我這邊AI也有給我替代方案是pymupdf去替代poppler,然後一樣用tesseract ocr
雅薰❤素亞娜
2 weeks ago @Edit 2 weeks ago
dx90c: 我從easyocr改的,所以目前改tesseract版本poppler不存在
(好像沒多少有32bit的ocr引擎)
我本來好像有看到x86的poppler,只是是中國的資源,要下載的話還要用微信或QQ登入什麼的,所以我就不敢用

AI找的其他英文論壇,的確有人提到,但是超連結也都已經失效ㄌ…感覺真的只能用別的東西來代替poppler了
舊的ocr引擎我根本不指望能用了,以前到處找ocr網站的經驗過於慘痛www