Kiel vi povas aliri la ĉerpitan tekston de bildo uzante la Google Vision API?

by Akademio de EITCA / Merkredon, la 27an de decembro 2023 / eldonita en Artefarita inteligento, API de Google Vision EITC/AI/GVAPI, Kompreno de teksto en vidaj datumoj, Detekti kaj ĉerpi tekston de manskribo, Ekzamena revizio

Por aliri la ĉerpitan tekston de bildo uzante la Google Vision API, vi povas sekvi serion de paŝoj, kiuj implikas uzi la optikajn karakterizajn rekonojn (OCR) de la API. La OCR-teknologio en la Google Vision API ebligas la detekton kaj eltiron de teksto de bildoj, inkluzive de manskribo. Ĉi tiu funkcieco estas precipe utila en aplikoj kiuj postulas la analizon kaj komprenon de tekstaj informoj ĉeestantaj en vidaj datenoj.

Unue, vi devas agordi la necesan medion por labori kun la API de Google Vision. Ĉi tio implicas krei projekton en la Google Cloud Console, ebligi la Vision API kaj akiri la postulatajn aŭtentikajn akreditaĵojn kiel API-ŝlosilo aŭ servokontoŝlosilo.

Post kiam via medio estas agordita, vi povas uzi la metodon "asyncBatchAnnotateFiles" de Vision API por fari OCR sur bilddosiero. Ĉi tiu metodo permesas al vi pasigi liston de bilddosieroj por prilaborado kaj ricevi la rezultojn nesinkrone. Alternative, vi povas uzi la metodon `asyncBatchAnnotateImages` por trakti liston de bildoj rekte.

Por ĉerpi tekston el bildo, vi devas krei ekzemplon de la objekto `AnnotateImageRequest` kaj specifi la deziratajn funkciojn. En ĉi tiu kazo, vi agordus la funkcion `TEXT_DETECTION` por indiki ke vi volas ĉerpi tekston el la bildo. Vi ankaŭ povas specifi pliajn parametrojn kiel la lingvosugesto por plibonigi la precizecon de la OCR.

Poste, vi devas kodi la bilddosieron en baz64-koditan ĉenon kaj krei ekzemplon de la objekto `Bildo' uzante la kodigitajn bildajn datumojn. Ĉi tiu objekto `Bildo` devus esti aldonita al la objekto `AnnotateImageRequest` kreita pli frue.

Post agordo de la peto, vi povas sendi ĝin al la Vision API per la metodo `batchAnnotateImages` aŭ `batchAnnotateFiles`, depende de via elektita aliro. La API prilaboros la bildon kaj resendos respondon enhavantan la eltiritan tekston.

Por aliri la ĉerpitan tekston de la respondo, vi povas ripeti sur la kampo `textAnnotations` de la objekto `AnnotateImageResponse`. Ĉi tiu kampo enhavas liston de objektoj `EntityAnnotation`, ĉiu reprezentante detektitan tekstan elementon en la bildo. La kampo `priskribo` de ĉiu objekto `EntityAnnotation` enhavas la eltiritan tekston.

Jen ekzemplo de kodo en Python, kiu montras kiel aliri la ĉerpitan tekston de bildo uzante la Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

En ĉi tiu ekzemplo, la funkcio `extract_text_from_image` prenas la vojon al bilddosiero kiel enigo kaj uzas la klientbibliotekon de Google Cloud Vision por sendi peton al la Vision API. La eltirita teksto tiam estas presita.

Por aliri la ĉerpitan tekston de bildo uzante la Google Vision API, vi devas agordi la medion, krei objekton `AnnotateImageRequest' kun la dezirataj funkcioj, kodi la bilddosieron, sendi la peton al la API kaj retrovi la eltirita tekston. de la respondo. La OCR-kapabloj de la Vision API ebligas la detekton kaj eltiron de teksto de bildoj, inkluzive de manskribo.

Aliaj lastatempaj demandoj kaj respondoj pri Detekti kaj ĉerpi tekston de manskribo:

Pliaj demandoj kaj respondoj:

Kampo: Artefarita inteligento
programo: API de Google Vision EITC/AI/GVAPI (iru al la atestprogramo)
Leciono: Kompreno de teksto en vidaj datumoj (iru al rilata leciono)
Fadeno: Detekti kaj ĉerpi tekston de manskribo (iru al rilata temo)
Ekzamena revizio

Etikedita sub: Artefarita inteligento, Google Cloud Vision API, Bildo-Prilaborado, OCR, Optika Karaktro-Rekono, Eltiro de teksto

Akademio de EITCA

Kiel vi povas aliri la ĉerpitan tekston de bildo uzante la Google Vision API?

Aliaj lastatempaj demandoj kaj respondoj pri Detekti kaj ĉerpi tekston de manskribo:

Pliaj demandoj kaj respondoj:

EITCA Akademio estas parto de la kadro de Eŭropa IT-Atestado

Kvalifiko por Subteno de Subvencio EITCA-Akademio 80% EITCI DSJC

Akademio de EITCA

Ensalutu Vian KONTAJN PER ĈIU VIA USERNAME aŭ retpoŝta adreso

Ĉu vi forgesis vian DETALOJ?

KREI ​​KONTON

Kiel vi povas aliri la ĉerpitan tekston de bildo uzante la Google Vision API?

Aliaj lastatempaj demandoj kaj respondoj pri Detekti kaj ĉerpi tekston de manskribo:

Pliaj demandoj kaj respondoj:

Kvalifiko por Subteno de Subvencio EITCA-Akademio 80% EITCI DSJC

KREI KONTON