Vytvořit SSIS a SSRS pracovní postupy s R o serveru SQL Server

  • 08/28/2020
  • 5 minut číst
    • d
    • M
    • D
    • c
    • +2

se Vztahuje na: SQL Serveru 2016 (13.x) a později

Tento článek vysvětluje, jak používat vložené R a Python skriptu pomocí jazyka a data science možnosti SQL Server Strojového Učení Služby s dvě důležité funkce serveru SQL Server: SQL Server Integration Services (SSIS) a SQL Server Reporting Services SSRS. Knihovny R a Python v SQL Serveru poskytují statistické a prediktivní funkce. SSIS a SSRS poskytují koordinovanou transformaci ETL a vizualizace. Tento článek vysvětluje, jak dát všechny tyto funkce dohromady v tomto vzoru pracovního postupu:

  • Vytvoření uložené procedury, která obsahuje spustitelný R nebo Python
  • Spustit uložené procedury z SSIS nebo SSRS

příklady v tomto článku jsou většinou o R a SSIS, ale pojmy a kroky se vztahují na Python. Druhá část poskytuje pokyny a odkazy pro vizualizace SSRS.

Použít SSIS pro automatizaci

Data science pracovní postupy jsou vysoce iterativní a zahrnují mnohem transformace dat, včetně měřítka, agregace, výpočty pravděpodobnosti, a přejmenování a sloučení atributy. Vědci v oblasti dat jsou zvyklí dělat mnoho z těchto úkolů v R, Pythonu nebo jiném jazyce; provádění takových pracovních postupů na podnikových datech však vyžaduje bezproblémovou integraci s nástroji a procesy ETL.

protože R Services (in-Database) umožňuje spouštět složité operace v R pomocí Transact-SQL a uložených procedur, můžete integrovat úlohy datové vědy s existujícími procesy ETL. Spíše než provádět řetězec úkolů náročných na paměť lze přípravu dat optimalizovat pomocí nejúčinnějších nástrojů, včetně integračních služeb a Transact-SQL.

zde je několik nápadů, jak automatizovat zpracování dat a modelování potrubí pomocí integračních služeb:

  • Extrahovat data z provozoven nebo zdrojů cloudu vybudovat tréninková data
  • vytvoření a spuštění R nebo Python modely jako součást integrace dat workflow
  • Rekvalifikaci modely na pravidelné (plánované) základ
  • Načíst výsledky z R nebo Python skript do dalších destinací, jako je Excel, Power BI, Oracle, Teradata, abychom jmenovali
  • Použít SSIS úkoly vytvořit datové funkce v SQL databázi
  • Použít podmíněné větvení pro přepínání výpočet kontext pro R a Python pracovních míst

SSIS příklad

Tento příklad ukazuje, jak automatizujte úkoly pomocí SSIS. Můžete vytvořit uložené procedury s vloženým R pomocí SQL Server Management Studio, a pak spustit ty uložené procedury z Execute T-SQL úkoly v balíčku SSIS.

Chcete-li projít tímto příkladem, měli byste být obeznámeni s Management Studio, SSIS, SSIS Designer, package design a T-SQL. Balíček SSIS používá tři Execute T-SQL úkoly, které vkládají tréninková data do tabulky, modelovat data, a skóre data získat výstup predikce.

načtěte tréninková data

Spusťte následující skript v SQL Server Management Studio a vytvořte tabulku pro ukládání dat. Pro toto cvičení byste měli vytvořit a použít testovací databázi.

Vytvořte uloženou proceduru, která načte tréninková data do datového rámce. Tento příklad používá vestavěnou datovou sadu Iris.

v aplikaci SSIS Designer vytvořte úlohu Execute SQL, která provede uloženou proceduru, kterou jste právě definovali. Skript pro SQLStatement odstraní existující data, určuje, která data chcete vložit, a poté zavolá uloženou proceduru, aby poskytla data.

Vygenerujte model

Spusťte následující skript v SQL Server Management Studio a vytvořte tabulku, která ukládá model.

Vytvořte uloženou proceduru, která generuje lineární model pomocí rxLinMod. RevoScaleR a revoscalepy knihovny jsou automaticky k dispozici v relacích R a Python na SQL Serveru, takže není třeba importovat knihovnu.

v aplikaci SSIS Designer vytvořte úlohu Execute SQL a spusťte uloženou proceduru generate_iris_rx_model. Model je serializován a uložen do tabulky ssis_iris_models. Skript pro SQLStatement je následující:

Jako kontrolní bod, poté, co tento úkol dokončí, můžete dotaz ssis_iris_models vidět, že to obsahuje jeden binární model.

předpovídat (skóre) výsledky pomocí „vyškoleného“ modelu

Nyní, když máte kód, který načte tréninková data a vygeneruje model, zbývá jediný krok pomocí modelu generovat předpovědi.

Chcete-li to provést, vložte skript R do dotazu SQL a spusťte vestavěnou funkci Rxpredict na ssis_iris_model. Uložená procedura s názvem predict_species_length tuto úlohu splní.

V SSIS Návrhář, vytvořit úkol Provést SQL, který spustí predict_species_length uložená procedura pro generování předpokládaná délka okvětní lístek.

exec predict_species_length 'rxLinMod';

spusťte řešení

v SSIS Designer, stisknutím klávesy F5 spusťte balíček. Měli byste vidět výsledek podobný následujícímu snímku obrazovky.

Použití SSRS pro vizualizace

i když R můžete vytvořit grafy a zajímavé vizualizace, to není dobře integrován s externími zdroji dat, což znamená, že každý graf nebo graf musí být individuálně vyrobené. Sdílení také může být obtížné.

pomocí R Služby (V Databázi), můžete spustit složité operace v R pomocí Transact-SQL uložené procedury, které mohou být snadno spotřebované řadu podnikových nástrojů pro podávání zpráv, včetně Zpráv Služby a Power BI.

příklady SSIS a SSRS v tomto článku ilustrují dva případy provádění uložených procedur, které obsahují vložený skript R nebo Python. Klíčovým stánek s jídlem je, že si můžete vytvořit R nebo Python skript k dispozici pro jakoukoli aplikaci nebo nástroj, který může poslat žádost o provedení na uložené procedury. Další stánek s jídlem pro SSIS je, že můžete vytvořit balíčky, které automatizovat a naplánovat širokou škálu operací, jako je získávání dat, čištění, manipulaci, a tak dále, s R nebo Python data science funkcí zahrnuty v řetězci operací. Další informace a nápady naleznete v části Operationalize R kód pomocí uložených procedur ve službách strojového učení SQL Server.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.