Bezproblémově vytvářejte a obnovujte datové sady ze souborů uložených v úložišti objektů OCI
V tomto příspěvku poskytujeme přehled a příklady vytváření datových sad ze souborů uložených v Oracle Cloud Infrastructure (OCI) Object Storage. Zkoumáme také nové možnosti s centralizovaným úložištěm souborů, které umožňuje plánovat periodické opětovné načítání dat uložených v Object Storage. Prozkoumáme vytvoření připojení OCI Resource včetně vytvoření datové sady pomocí nového připojení, použití nového uživatelského rozhraní k prohledávání a procházení oddílů, bucketů a objektů a vytváření datových sad na základě některých souborů. Nakonec popisujeme, jak můžete ručně znovu načíst nebo naplánovat pravidelné načítání datové sady aktualizací souborů v Object Storage.
Co je úložiště objektů OCI?
OCI Object Storage vám umožňuje bezpečně ukládat jakýkoli typ dat v jeho nativním formátu. Díky vestavěné redundanci je OCI Object Storage ideální pro vytváření moderních aplikací, které vyžadují rozsah a flexibilitu, protože jej lze použít ke konsolidaci více zdrojů dat pro účely analýzy, zálohování nebo archivace. Pro podrobnější informace o OCI Object Storage navštivte tuto stránku: OCI Object Storage.
Vytvoření připojení k prostředkům OCI
Chcete-li získat přístup k souborům uloženým v úložišti objektů OCI, musíte nejprve vytvořit připojení prostředků OCI pomocí klíče API. Toto připojení je stejný typ připojení, který je vyžadován pro připojení Oracle Analytics k funkcím OCI a modelům OCI, jako je Vision a Language. Úplné pokyny, jak vytvořit připojení ke zdrojům OCI, naleznete na této stránce: Vytvoření připojení k vašemu pronájmu OCI.
Vytváření datových sad ze souborů v OCI Object Storage
Po úspěšném vytvoření připojení můžete zahájit proces vytváření datových sad ze souborů v segmentech OCI Object Storage. Začněte proces vytvořením datové sady kliknutím na Vytvořit datovou sadu na domovské stránce. Všimněte si, že OCI Resource Connection se zobrazuje jako jeden ze zdrojů dat v dialogovém okně Create Dataset.
Výběr regionu
Po výběru připojení OCI použijte dialogové okno ke změně výchozí oblasti, pokud je to nutné, a ke snadnému vyhledání správných přihrádek, kbelíků a objektů, které by mohly zahrnovat složky, podsložky a soubory. Zkontrolujte výchozí oblast a v případě potřeby ji změňte pomocí rozevíracího seznamu.
Navigace a vyhledávání přihrádek
Po výběru nebo zachování výchozí oblasti buď ručně procházejte, nebo zadejte úplný nebo částečný vyhledávací řetězec a prohledejte všechny oddíly. Výsledky vyhledávání jsou filtrovány, aby se zobrazily pouze ty oddíly, které splňují kritéria vyhledávání. Vyhledávání je pomocí zástupných znaků, bez ohledu na velikost písmen.
Navigace a vyhledávání segmentů
Po kliknutí na správnou přihrádku, kde jsou kbelíky umístěny, proveďte stejný typ navigace nebo vyhledávání pomocí zástupných znaků na kbelících. Po vyhledání segmentu, ve kterém jsou soubory umístěny, na něj klikněte a všimněte si, že všechny objekty ve vybraném segmentu jsou zobrazeny na pravém panelu.
Navigace a vyhledávání objektů a výběr souboru
Opět ručně procházejte objekty v bloku, který se může skládat ze složek, podsložek a souborů, nebo provádějte vyhledávání bez ohledu na velikost písmen. Po vyhledání souboru, který chcete importovat do datové sady, klikněte na OK. Systém importuje soubor do OAC a poskytne náhled obsahu souboru ke kontrole. Po kontrole kliknutím na OK přenesete soubor do Editoru datové sady, kde se extrahuje reprezentativní vzorek a spustí se hluboký sémantický profil a výsledky se zobrazí ve formě Data Quality Insights pro obsah souboru.
Přidání dalšího souboru ze stejného připojení OCI
Po vytvoření tabulky založené na souboru z bucketu OCI Object Storage si všimněte, že připojení (My OCI Connection), prostředek (OCI Object Storage) a importovaný soubor jsou uvedeny na levém panelu. Chcete-li přidat další soubor ze stejného připojení, klikněte na ikonu napravo od zdroje. Po kliknutí na tuto ikonu se znovu zobrazí navigační dialog a můžete se znovu ponořit do kbelíku a získat druhý soubor. Přidejte tolik souborů, kolik potřebujete, a připojte je k vytvoření datové sady. Můžete také spojit soubory z OCI Object Storage s databázovými tabulkami a dalšími soubory.
Extrahovat kredit – naplánování opětovného načtení datové sady
Jednou z opravdu skvělých výhod vytváření datových sad ze souborů v segmentech OCI Object Storage je to, že můžete vytvořit opakující se pracovní postup, kde může upstream proces pravidelně umisťovat aktualizované soubory se stejným názvem do stejného segmentu. Poté můžete naplánovat obnovení datové sady, aby se automaticky aktualizovala data v mezipaměti z těchto aktualizovaných souborů. Můžete nastavit buď jednorázový, nebo opakující se plán. Kromě toho můžete zkontrolovat podrobnosti plánu, abyste viděli poslední čas spuštění a další naplánované spuštění. Tento proces a schopnost poskytuje způsob, jak aktualizovat vizualizace nejnovějšími daty z datových sad založených na souborech. Úplné pokyny, jak vytvořit jednorázový nebo opakující se plán, najdete zde: Práce s plány obnovení datové sady
Výzva k akci
Doufáme, že se vám tento přehled vytváření datových sad ze souborů v bucketech OCI Object Storage líbil! A vyzýváme vás, abyste začali vytvářet datové sady ze svých souborů uložených v bucklech, a doufáme, že je shledáte výkonnými a uživatelsky přívětivými. Pokračujte v objevování výkonného světa samoobslužného modelování dat a zůstaňte naladěni na naše nadcházející blogové příspěvky, kde budeme sdílet další tipy a triky týkající se nových i stávajících funkcí našeho produktu.
Zdroj: Oracle