Článek přečtěte do 4 min.

Provádění úplného opětovného načtení datové sady do mezipaměti může být časově náročné a neefektivní, zvláště když bylo aktualizováno nebo přidáno pouze několik řádků ve zdrojovém systému. Funkce inkrementálního načítání datových sad uložených v mezipaměti Oracle Analytics řeší tento problém zavedením řešení optimalizovaného pro výkon, které zkracuje dobu načítání a zvyšuje efektivitu.

Přehled možností opětovného načtení

Oracle Analytics nabízí tři možnosti opětovného načtení dat uložených v mezipaměti, které lze nakonfigurovat pro podporované zdroje dat na obrazovce Upravit definici:

1. Nahradit existující data – Provede úplné opětovné načtení datové sady.

2. Načíst nová a aktualizovaná data – funguje jako upsert; tento typ opětovného načtení přidává nové záznamy, které aktuálně v mezipaměti neexistují, a aktualizuje existující záznamy, které byly změněny od posledního opětovného načtení.

3. Přidat nová data ke stávajícím datům – funguje jako vložka; to přidá nové záznamy, které aktuálně v mezipaměti neexistují.

Oracle Analytics poskytuje možnosti postupného opětovného načítání pro několik zdrojů, včetně Oracle Database, Oracle Applications, DB2, MySQL a dalších.

Konfigurace typů obnovení mezipaměti

Jak bylo uvedeno, mezipaměť lze konfigurovat na obrazovce Upravit definici na úrovni tabulky pro tabulky, které získávají z podporovaných zdrojů dat. Jakmile je tabulka nastavena na Automatické ukládání do mezipaměti, v rozevírací nabídce se zobrazí tři typy obnovení mezipaměti.

Obrazovka Upravit definici

  1. Nahradit existující data: Když je tabulka nastavena na Nahradit existující data, po opětovném načtení se znovu zaplní celá mezipaměť. Pro konfiguraci nejsou vyžadována žádná další pole.

Nahradit existující data

  1. Načíst nová a aktualizovaná data: Pokud je tabulka nastavena na Načíst nová a aktualizovaná data, je třeba nakonfigurovat několik dalších polí.
  • Sloupce uživatelského klíče: Toto povinné pole se používá k identifikaci nových záznamů. Uživatelé mohou v případě potřeby vybrat více sloupců pro identifikaci jedinečných záznamů.
  • New Data Indicator Column(s): Toto povinné pole určuje, zda byla data přidána nebo aktualizována ve zdrojovém systému. Vybrané sloupce musí obsahovat datum nebo časové razítko.
  • Incremental Offset Time: Toto volitelné pole identifikuje, jak moc OAC upraví čas opětovného načtení, aby zohlednil nesrovnalosti v časovém pásmu v systému zdroje dat.

Načíst nové a aktualizované

  1. Přidat nová data ke stávajícím datům: Podobně jako k načtení nových a aktualizovaných dat, když je tabulka nastavena na Přidat nová data ke stávajícím datům, je třeba nakonfigurovat stejná pole.

Přidat nové ke stávajícím

Provedení Reload

Chcete-li znovu načíst datovou sadu, otevřete nabídku akcí a vyberte Znovu načíst data“. Tím se otevře panel Kontrola na kartě s názvem „Znovu načíst data“. Pokud je vaše tabulka datové sady nakonfigurována s možností přírůstkového ukládání do mezipaměti, uvidíte dva přepínače: Spustit znovu načíst, Spustit úplné znovu načíst a tlačítko: Spustit nyní.

  • Spustit znovu načíst: Když je vybrána tato možnost a klepnete na tlačítko Spustit nyní, vybrané tabulky se znovu načtou na základě jejich konfigurace mezipaměti.
  • Run Full Reload: Když je vybrána tato možnost a klepnete na tlačítko Run Now, vybrané tabulky provedou úplné znovu načtení.

Nabídka akcí

Karta Znovu načíst data

Příklad: Přidat nová data k existujícím

Scénář:  Oracle Analytics funguje v UTC, ale váš zdrojový systém zaznamenává aktivity s časovými razítky v tichomořském čase (8 hodinový rozdíl).

Konfigurace mezipaměti:

  • Nový datový indikátor: transaction_timestamp
  • Uživatelský klíč: transaction_id
  • Inc Offset Time: 8 hodin

1. První úplné znovu načtení

  • Čas OAC: 6/11 04:00 (UTC)
  • Čas zdroje: 6/10 20:00 (PT)

Toto je aktuálně v mezipaměti OAC po úplném opětovném načtení:

id_transakce

transakční_časové razítko

amt

1 2024-06-10, 17:00:00 100
2 2024-06-10, 18:00:00 102
3 2024-06-10, 19:00:00 200

Do zdrojové systémové databáze jsou přidány následující řádky:

id_transakce

transakční_časové razítko

amt

4 2024-06-10 20:30:00 210
5 2024-06-10, 21:00:00 215

2. První přírůstkové zatížení

  • Čas OAC: 6/11 06:00 (UTC)
  • Čas zdroje: 6/10 22:00 (PT)

S offsetem: Kde transaction_timestamp> čas posledního načtení – čas offsetu

  • transaction_timestamp> 04:00 (UTC) – 8 hodin
  • transaction_timestamp> 20:00 (PT) 6. 10

Nová mezipaměť OAC po prvním přírůstkovém opětovném načtení:

id_transakce

transakční_časové razítko

amt

1 2024-06-10, 17:00:00 100
2 2024-06-10, 18:00:00 102
3 2024-06-10, 19:00:00 200
4 2024-06-10 20:30:00 210
5 2024-06-10, 21:00:00 215

Výzva k akci

Doporučuji vám, abyste se naučili, jak optimalizovat opětovné načítání datové sady pomocí funkce přírůstkového načítání. Další informace o přírůstkovém načítání naleznete v tomto videu YouTube a v tomto zdroji.

Zdroj: Oracle