Logo Crossweb

Logowanie

Nie masz konta? Zapomniałem hasła

Przypomnij hasło

close Wypełnij formularz.
Na Twój adres e-mail zostanie wysłane link umożliwiający zmianę hasła.
Wyślij
To wydarzenie już się odbyło. Sprawdź nadchodzące wydarzenia

Toruń JUG: Warsztaty Spark

Wydarzenie:
Toruń JUG: Warsztaty Spark
Typ wydarzenia:
Spotkanie
Kategoria:
IT
Tematyka:
Data:
23.02.2018 (piątek)
Godzina:
18:00
Język:
polski
Wstęp:
Bezpłatne
Miasto:
Miejsce:
Business Link Toruń
Adres:
Łokietka 5
Opis:

Zapraszamy serdecznie na Warsztaty Sparka zorganizowane przez Toruń Java User Group, które odbędą się w piątek, 23 lutego 2018 roku w godzinach 18:00-20:00 w budynku Business Link Toruń przy ulicy Władysława Łokietka 5 w Toruniu.


Wstęp na spotkanie jest wolny, obecność na wcześniejszych spotkaniach nie jest wymagana - pomiędzy spotkaniami nie ma żadnych zależności, do naszej społeczności można dołączyć w dowolnym momencie. Na spotkanie możesz przyjść bez rejestracji na portalu Meetup, jednak pojemność sali warsztatowej jest ograniczona (16 miejsc), więc prosimy o rejestrację ze względów organizacyjnych.


Czy chodziło Ci o....?


Po internecie krąży miejska legenda, jakoby pewnego dnia algorytmy Tesco słusznie przewidziały, że ich klientka jest w ciąży bazując na jej zakupach, które niewiele miały wspólnego z macierzyństem (http://www.businessinsider.com/the-incredible-story-of-how-target-exposed-a-teen-girls-pregnancy-2012-2). Jak w każdej legendzie, i w tej musi być ziarno prawdy. Mając pokaźny zbiór danych i stosując techniki znane już w latach 60' (!) (https://en.wikipedia.org/wiki/Association_rule_learning) można sprawnie określić powiązania niewidoczne na pierwszy rzut oka.

W trakcie warsztatów zaimplementujesz prostą wersję takiego algorytmu - silnik rekomentacji dla wyszukiwarki, zbliżony do google'owego "did you mean..." albo "related phrases". Przy okazji nauczysz się pracować w sparku i wykonywać podstawowe operacje: transformacje, agregacje i łączenie zbiorów danych. Znajomość podstaw pythona lub scali jest bardzo mile widziana. Nie musisz przynosić ze sobą 16-corowego laptopa - wykorzystamy chmurową platformę Databricks. Załóż wcześniej darmowe konto typu "community edition" na https://databricks.com/try-databricks


O prowadzącym: Mariusz Strzelecki - Fan(atyk) danych (głównie tych dużych, ale tych istotnych też ;-). Przemierza świat Big Data od ponad 3 lat.


Profile pracodawców

Podobne wydarzenia