Řešení Oracle Analytics se nyní integrují s porozumění dokumentům Oracle Cloud Infrastructure (OCI) AI!
AI Document Understanding je služba OCI AI, která umožňuje vývojářům extrahovat text, tabulky a další klíčová data ze souborů dokumentů pomocí rozhraní API a nástrojů rozhraní příkazového řádku. S OCI AI Document Understanding můžete automatizovat zdlouhavé obchodní úlohy zpracování pomocí předem sestavených modelů AI a přizpůsobit extrakci dokumentů tak, aby vyhovovaly vašim specifickým potřebám.
Můžete použít předem připravené modely pro extrakci textu, extrakci tabulek, extrakci klíčových hodnot a klasifikaci dokumentů. Jakmile si vyberete předem trénovaný model, můžete nahrát své obrázky, poté model zaregistrovat v Oracle Analytics Cloud (OAC) a použít svůj model v datový tok pro extrakci klíčových hodnot ze životopisu, pasu, účtenky nebo faktury.
Zde je návod, jak můžete vytvořit projekt vizualizace dat založený na porozumění dokumentu OCI AI ve 4 krocích do 5 minut.
Postup je následující:
- Nahrajte ukázkové obrázky pasů do služby Oracle Cloud do veřejného úložiště objektů.
- Zaregistrujte si model porozumění dokumentům OCI AI ve službě Oracle Analytics Cloud.
- Vytvořte datový tok pro použití modelu AI na ukázkové obrázky pasů.
- Přidejte rozpoznané klíčové hodnoty do datové sady a použijte tuto datovou sadu v sešitu k vizualizaci dat.
Předpokladem je mít instanci Oracle Analytics Cloud s připojením k OCI.
Krok 1 – Vytvořte bucket v OCI
- Připojte se k OCI na této adrese URL: https://www.oracle.com/cloud/sign-in.html
- Klikněte na možnost nabídky, poté Úložiště vytvořte Segment a nastavte název.
- Nahrajte do bucketu všechny obrázky dokumentů potřebné k trénování a testování vašeho modelu.
- Prozatím zveřejněte bucket. V tomto příkladu je bucket „Bucket-vision-ai“, který byl dříve vytvořen, a do složky s názvem AID jsem nahrál 9 vzorových pasových obrázků.
Tento krok vygeneruje umístění, kde bude mít OAC přístup k nahraným obrázkům a použít model AI.
Krok 2 – Zaregistrujte svůj model v cloudu Oracle Analytics
- Na domovské stránce OAC klikněte na nabídku 3 malých teček („…“ nebo tři tečky) v pravém horním rohu.
- Vyberte „Registrovat model/funkci“ a vyberte „OCI Document Understanding Models“
- Po výběru vyberte připojení OCI. Pokud neexistuje, budete muset vytvořit nové připojení v OAC (Create > Connection > OCI Resource).
- Vyskočí okno „Vyberte model“. Vyberte typ modelu „Extrakce předtrénované hodnoty klíče dokumentu“.
- V pravém postranním panelu vyberte svůj OCI Bucket a vyberte typ dokumentu. V tomto příkladu je to „Pas“.
Krok 3 – Použijte model AI na své obrázky
- Vytvořte nový datový tok v OAC.
- Vytvořte datovou sadu pomocí souboru CSV včetně vaší adresy URL segmentu.
- Přidejte datovou sadu do datového toku.
- Přidejte krok „Použít model umělé inteligence“, abyste na obrázky použili svůj předem trénovaný model umělé inteligence. Pokud používáte datovou sadu zobrazující obrázky jako řádkovou položku, vyberte adresu URL segmentu v Parametrech nebo Umístění souboru.
- Vyberte „Dokumenty“ jako Typ vstupu, pokud používáte obrázky rozdělené na jednotlivé položky, nebo „Segmenty“, pokud používáte adresu URL svého segmentu.
- Přidejte krok pro uložení dat do nové datové sady. Uložená data by měla obsahovat název obrázku a adresy URL a také extrahovaný text/číslo klíčových hodnot.
Datový tok načte snímky, analyzuje je pomocí předem trénovaného modelu umělé inteligence a extrahuje klíčové hodnoty ze snímků. V tomto příkladu pasové dokumenty. Poté datový tok načte všechny informace do datové sady, kterou můžete použít k prozkoumání a vizualizaci dat.
Krok 4 – Vizualizujte výsledky v Oracle Analytics.
- Vytvořte nový Sešit v OAC.
- Přidejte novou datovou sadu vygenerovanou datovým tokem.
- Přidejte Obrázkový plugin vizualizační objekt, abyste viděli všechny obrázky ve vašem segmentu.
- Použijte tento objekt obrázku jako filtr kliknutím na ikonu filtru v levém horním rohu.
- Vytvořte novou tabulku, která zobrazí všechny sloupce vaší datové sady.
- Kliknutím na jeden z obrázků pasu zobrazíte extrahovanou hodnotu klíče v tabulce.
- Nyní můžete tento sešit použít jako výchozí bod k vytvoření dalších výpočtových metrik pro filtrování a analýzu dokumentů. V tomto příkladu jsem se rozhodl analyzovat datum vypršení platnosti a vytvořit koblihu podmíněného formátování, abych ukázal, zda vypršela (červená) nebo prošla (zelená).
Zákazníci používají OCI AI Document Understanding k rozpoznání různých typů dokumentů ve velkém měřítku, od pasů přes faktury až po účtenky a životopisy. Oracle Analytics umožňuje aplikovat a vizualizovat data během několika minut, což vám pomůže rychle přejít od dat ke statistikám, akcím a rozhodnutím.
Tipy pro vizualizaci dat
- Pokud máte problémy se zobrazením obrázků a zjištěných objektů, zadejte do prohlížeče Google Chrome tuto adresu URL: chrome://flags/#block-insecure-private-network-requests.
- Možná budete pro Google Chrome potřebovat následující rozšíření: https://chrome.google.com/webstore/detail/always-disable-content-se/ffelghdomoehpceihalcnbmnodohkibj?utm_source= ikona chrome-ntp
- Pokud máte problémy s přístupem k úložišti objektů, dočasně deaktivujte také možnost „Blokovat nezabezpečené požadavky privátní sítě“ jako test ladění.
Zdroj: Oracle