Wojciech Zduniak, Autor w serwisie SCRIPT FACTORY

About Wojciech Zduniak

BI zajmuję się kilkanaście lat, od Microsoft po Teradatę, od on-premise do cloud, od pojedyńczych serwerów po klastrów obliczeniowych. Temat jest tak szeroki i ciekawy że postanowiłem opisać po kolei wszystko co wiem i z czym się zetknąłem. Mam nadzieje że będzie Wam się podobać ta lektura :)

Migracja zasobów Azure Databricks cz. 1

Wprowadzenie: Azure Databricks jest doskonałą platformą do wykonania analiz , czy procesowania znacznej ilości danych tzw. Big Data. Jednak nie jest to jeszcze do końca dojrzała platforma. Przez co często... read more →

Monitoring Azure Databricks

Głównym problemem usługi Azure Databricks jest brak odpowiedniego monitorowania zasobów (ich użycia Procesora/Pamięci/Dysku/Transferu sieciowego) , jest to możliwe per klaster w Spark UI jako snapshot działania drivera i nodów, brak... read more →

9 lutego 2022
Wojciech Zduniak
Azure, Databricks, Log Analytics, Tricks & Tips

Undelete na dużej ilości plików

Pewnie spotkałeś/łaś się do tej pory z problemem wykonania operacji Undelete na Azure Storage Account w przypadku kiedy na kontenerze znajdują się miliony plików, i istotna część z nich została... read more →

Jak rozpocząć pracę z Azure Databricks

Platforma Azure Databricks Azure Databricks to zarządzana platforma Big Data oparta o koncepcję ekosystemu Hadoop, lecz nie wymusza na użytkowniku wysokiej wiedzy technicznej do jej utrzymania. Oparta jest o Sparka... read more →

Data Warehouse i przetwarzanie plików

Wprowadzenie: Przed Wami kolejny z serii artykułów poświęconych analizie środowisk w chmurze, takich jak Google, AWS, Azure pod kontem użyteczności w obróbce danych. Skupimy się w nim na środowisku Azure,... read more →

24 marca 2019
Wojciech Zduniak
Azure, SQL Data Warehouse, Storage, Synapse

BigQuery i przetwarzanie plików

Wprowadzenie: W związku z rosnącą popularnością platform chmurowych, takich jak Google, AWS i Azure, postanowiliśmy stworzyć serię artykułów, w których omówimy podstawowe funkcjonalności tych środowisk na konkretnych przykładach użycia. Zacznijmy od Google oraz jednego... read more →

Instalacja Apache Hadoop w Chmurze

Wprowadzenie: Apache Hadoop jest otwartą platformą programistyczną stworzoną w języku Java. Platforma przeznaczona jest do przetwarzania dużych ilości danych w rozproszonym środowisku, skalowalnym i rozszerzalnym horyzontalnie. Hadoop składa się z... read more →

About Wojciech Zduniak

Migracja zasobów Azure Databricks cz. 1

Monitoring Azure Databricks

Undelete na dużej ilości plików

Kategorie

Najnowsze posty: