Por aliri la ĉerpitan tekston de bildo uzante la Google Vision API, vi povas sekvi serion de paŝoj, kiuj implikas uzi la optikajn karakterizajn rekonojn (OCR) de la API. La OCR-teknologio en la Google Vision API ebligas la detekton kaj eltiron de teksto de bildoj, inkluzive de manskribo. Ĉi tiu funkcieco estas precipe utila en aplikoj kiuj postulas la analizon kaj komprenon de tekstaj informoj ĉeestantaj en vidaj datenoj.
Unue, vi devas agordi la necesan medion por labori kun la API de Google Vision. Ĉi tio implicas krei projekton en la Google Cloud Console, ebligi la Vision API kaj akiri la postulatajn aŭtentikajn akreditaĵojn kiel API-ŝlosilo aŭ servokontoŝlosilo.
Post kiam via medio estas agordita, vi povas uzi la metodon "asyncBatchAnnotateFiles" de Vision API por fari OCR sur bilddosiero. Ĉi tiu metodo permesas al vi pasigi liston de bilddosieroj por prilaborado kaj ricevi la rezultojn nesinkrone. Alternative, vi povas uzi la metodon `asyncBatchAnnotateImages` por trakti liston de bildoj rekte.
Por ĉerpi tekston el bildo, vi devas krei ekzemplon de la objekto `AnnotateImageRequest` kaj specifi la deziratajn funkciojn. En ĉi tiu kazo, vi agordus la funkcion `TEXT_DETECTION` por indiki ke vi volas ĉerpi tekston el la bildo. Vi ankaŭ povas specifi pliajn parametrojn kiel la lingvosugesto por plibonigi la precizecon de la OCR.
Poste, vi devas kodi la bilddosieron en baz64-koditan ĉenon kaj krei ekzemplon de la objekto `Bildo' uzante la kodigitajn bildajn datumojn. Ĉi tiu objekto `Bildo` devus esti aldonita al la objekto `AnnotateImageRequest` kreita pli frue.
Post agordo de la peto, vi povas sendi ĝin al la Vision API per la metodo `batchAnnotateImages` aŭ `batchAnnotateFiles`, depende de via elektita aliro. La API prilaboros la bildon kaj resendos respondon enhavantan la eltiritan tekston.
Por aliri la ĉerpitan tekston de la respondo, vi povas ripeti sur la kampo `textAnnotations` de la objekto `AnnotateImageResponse`. Ĉi tiu kampo enhavas liston de objektoj `EntityAnnotation`, ĉiu reprezentante detektitan tekstan elementon en la bildo. La kampo `priskribo` de ĉiu objekto `EntityAnnotation` enhavas la eltiritan tekston.
Jen ekzemplo de kodo en Python, kiu montras kiel aliri la ĉerpitan tekston de bildo uzante la Google Vision API:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
En ĉi tiu ekzemplo, la funkcio `extract_text_from_image` prenas la vojon al bilddosiero kiel enigo kaj uzas la klientbibliotekon de Google Cloud Vision por sendi peton al la Vision API. La eltirita teksto tiam estas presita.
Por aliri la ĉerpitan tekston de bildo uzante la Google Vision API, vi devas agordi la medion, krei objekton `AnnotateImageRequest' kun la dezirataj funkcioj, kodi la bilddosieron, sendi la peton al la API kaj retrovi la eltirita tekston. de la respondo. La OCR-kapabloj de la Vision API ebligas la detekton kaj eltiron de teksto de bildoj, inkluzive de manskribo.
Aliaj lastatempaj demandoj kaj respondoj pri Detekti kaj ĉerpi tekston de manskribo:
- Kiuj limigoj povas aperi kiam oni ĉerpas tekston de kompleksaj dokumentoj uzante la Google Vision API?
- Kio estas la signifo de konfidaj niveloj en la interpreto de teksto de la Google Vision API?
- Kiel povas la Google Vision API precize rekoni kaj ĉerpi tekston el manskribitaj notoj?
- Kio estas la defioj por detekti kaj ĉerpi tekston el manskribitaj bildoj?
- Ĉu Google Vision povas rekoni manskribon?