Provádění úplného opětovného načtení datové sady do mezipaměti může být časově náročné a neefektivní, zvláště když bylo aktualizováno nebo přidáno pouze několik řádků ve zdrojovém systému. Funkce inkrementálního načítání datových sad uložených v mezipaměti Oracle Analytics řeší tento problém zavedením řešení optimalizovaného pro výkon, které zkracuje dobu načítání a zvyšuje efektivitu.
Přehled možností opětovného načtení
Oracle Analytics nabízí tři možnosti opětovného načtení dat uložených v mezipaměti, které lze nakonfigurovat pro podporované zdroje dat na obrazovce Upravit definici:
1. Nahradit existující data – Provede úplné opětovné načtení datové sady.
2. Načíst nová a aktualizovaná data – funguje jako upsert; tento typ opětovného načtení přidává nové záznamy, které aktuálně v mezipaměti neexistují, a aktualizuje existující záznamy, které byly změněny od posledního opětovného načtení.
3. Přidat nová data ke stávajícím datům – funguje jako vložka; to přidá nové záznamy, které aktuálně v mezipaměti neexistují.
Oracle Analytics poskytuje možnosti postupného opětovného načítání pro několik zdrojů, včetně Oracle Database, Oracle Applications, DB2, MySQL a dalších.
Konfigurace typů obnovení mezipaměti
Jak bylo uvedeno, mezipaměť lze konfigurovat na obrazovce Upravit definici na úrovni tabulky pro tabulky, které získávají z podporovaných zdrojů dat. Jakmile je tabulka nastavena na Automatické ukládání do mezipaměti, v rozevírací nabídce se zobrazí tři typy obnovení mezipaměti.
- Nahradit existující data: Když je tabulka nastavena na Nahradit existující data, po opětovném načtení se znovu zaplní celá mezipaměť. Pro konfiguraci nejsou vyžadována žádná další pole.
- Načíst nová a aktualizovaná data: Pokud je tabulka nastavena na Načíst nová a aktualizovaná data, je třeba nakonfigurovat několik dalších polí.
- Sloupce uživatelského klíče: Toto povinné pole se používá k identifikaci nových záznamů. Uživatelé mohou v případě potřeby vybrat více sloupců pro identifikaci jedinečných záznamů.
- New Data Indicator Column(s): Toto povinné pole určuje, zda byla data přidána nebo aktualizována ve zdrojovém systému. Vybrané sloupce musí obsahovat datum nebo časové razítko.
- Incremental Offset Time: Toto volitelné pole identifikuje, jak moc OAC upraví čas opětovného načtení, aby zohlednil nesrovnalosti v časovém pásmu v systému zdroje dat.
- Přidat nová data ke stávajícím datům: Podobně jako k načtení nových a aktualizovaných dat, když je tabulka nastavena na Přidat nová data ke stávajícím datům, je třeba nakonfigurovat stejná pole.
Provedení Reload
Chcete-li znovu načíst datovou sadu, otevřete nabídku akcí a vyberte „Znovu načíst data“. Tím se otevře panel Kontrola na kartě s názvem „Znovu načíst data“. Pokud je vaše tabulka datové sady nakonfigurována s možností přírůstkového ukládání do mezipaměti, uvidíte dva přepínače: Spustit znovu načíst, Spustit úplné znovu načíst a tlačítko: Spustit nyní.
- Spustit znovu načíst: Když je vybrána tato možnost a klepnete na tlačítko Spustit nyní, vybrané tabulky se znovu načtou na základě jejich konfigurace mezipaměti.
- Run Full Reload: Když je vybrána tato možnost a klepnete na tlačítko Run Now, vybrané tabulky provedou úplné znovu načtení.
Příklad: Přidat nová data k existujícím
Scénář: Oracle Analytics funguje v UTC, ale váš zdrojový systém zaznamenává aktivity s časovými razítky v tichomořském čase (8 hodinový rozdíl).
Konfigurace mezipaměti:
- Nový datový indikátor:
transaction_timestamp
- Uživatelský klíč:
transaction_id
- Inc Offset Time: 8 hodin
1. První úplné znovu načtení
- Čas OAC: 6/11 04:00 (UTC)
- Čas zdroje: 6/10 20:00 (PT)
Toto je aktuálně v mezipaměti OAC po úplném opětovném načtení:
id_transakce |
transakční_časové razítko |
amt |
1 | 2024-06-10, 17:00:00 | 100 |
2 | 2024-06-10, 18:00:00 | 102 |
3 | 2024-06-10, 19:00:00 | 200 |
Do zdrojové systémové databáze jsou přidány následující řádky:
id_transakce |
transakční_časové razítko |
amt |
4 | 2024-06-10 20:30:00 | 210 |
5 | 2024-06-10, 21:00:00 | 215 |
2. První přírůstkové zatížení
- Čas OAC: 6/11 06:00 (UTC)
- Čas zdroje: 6/10 22:00 (PT)
S offsetem: Kde transaction_timestamp
> čas posledního načtení – čas offsetu
transaction_timestamp
> 04:00 (UTC) – 8 hodintransaction_timestamp
> 20:00 (PT) 6. 10
Nová mezipaměť OAC po prvním přírůstkovém opětovném načtení:
id_transakce |
transakční_časové razítko |
amt |
1 | 2024-06-10, 17:00:00 | 100 |
2 | 2024-06-10, 18:00:00 | 102 |
3 | 2024-06-10, 19:00:00 | 200 |
4 | 2024-06-10 20:30:00 | 210 |
5 | 2024-06-10, 21:00:00 | 215 |
Výzva k akci
Doporučuji vám, abyste se naučili, jak optimalizovat opětovné načítání datové sady pomocí funkce přírůstkového načítání. Další informace o přírůstkovém načítání naleznete v tomto videu YouTube a v tomto zdroji.
Zdroj: Oracle