Vianočné piesne sú neoddeliteľnou súčasťou sviatočnej atmosféry. S príchodom digitálnej éry sa objavujú nové spôsoby, ako k nim pristupovať a analyzovať ich. Táto oblasť zahŕňa nielen tradičnú tvorbu, ale aj modernú analýzu obľúbenosti a sentimentu, či autorské prístupy súčasných umelcov.
Analýza vianočných piesní zo Spotify
Čo keby sme sa pri vytváraní vianočných playlistov neriadili našimi preferenciami, ale dátami? Rozhodlo sa, že sa na to skúsi pozrieť, hoci výsledok bol neistý. Práca na tomto projekte znamenala vyhľadávanie a počúvanie veľkého množstva vianočných skladieb. To znamená, že personalizované odporúčania v Spotify sú takýmto experimentovaním značne ovplyvnené.
Začiatok článku o zbere a vyhodnocovaní dát je pre hardcore analytikov. Neskôr nájdete ešte viac zaujímavých štatistík. V kútiku duše analytik dúfal, že Vianoce prídu o čosi skôr a nájde dataset vianočných pesničiek vhodný na analýzu. Stačilo by, aby dataset obsahoval názov skladby, interpreta a dátum vydania, prípadne akékoľvek ďalšie zaujímavé údaje, ktoré by sa dali pri analýze využiť.
Vianočný zázrak sa však nestal a nič schopné sa nenašlo. Po krátkom Googlení sa však našťastie natrafilo na Spotify API. Získanie dát a ich analyzovanie bolo náročné, najmä vzhľadom na obmedzené skúsenosti s programovacím jazykom R.
Zber a predbežné spracovanie dát
Pre analýzu boli vianočné pesničky získané zo štyroch najpočúvanejších vianočných playlistov: „Christmas Hits“, „Christmas Classics“, „Christmas Pop“ a „Christmas Is Coming“. Pridávanie ďalších playlistov už nedávalo veľký zmysel, nakoľko by aj tak väčšinou obsahovali tie isté skladby. Cez Spotify API je možné získať skutočne veľké množstvo dát. Každá skladba obsahuje základné údaje ako názov a ID skladby, meno interpreta, rok vydania, dĺžka skladby (v ms) a album, na ktorom vyšla.
Metriky pre analýzu skladieb
Okrem základných údajov sú k dispozícii aj špecifické metriky, ktoré umožňujú hlbšiu analýzu:
- Danceability - táto metrika určuje, ako dobre sa na skladbu tancuje. Algoritmus na určenie tejto hodnoty zohľadňuje viacero faktorov, napríklad tempo, stálosť rytmu, pravidelnosť skladby atď.
- Energy - typicky energické skladby sú rýchle a hlasné.
- Speechiness - metrika predstavuje, koľko hovoreného slova skladba obsahuje.
- Valence - zaujímavá metrika, ktorá meria pozitivitu skladby.
- Popularity - popularita skladby, hodnota od 0 po 100, kde 100 predstavuje momentálne najpopulárnejšiu skladbu. Táto metrika je úzko prepojená s aktuálnou počúvanosťou skladby.
Tieto metriky sú síce „black-box“, teda ich presný výpočet nie je verejný, no predpokladá sa, že odborníci zo Spotify vedia, čo robia.
Čistenie datasetu a získavanie textov
Po nazbieraní dát o všetkých pesničkách nasledovalo čistenie datasetu. Prvým krokom bolo odstránenie duplicitných pesničiek. Najskôr sa odstránili všetky riadky s rovnakým track.id. Tento postup však neodstránil rovnaké skladby, ktoré sa nachádzali na iných albumoch (tieto skladby majú rôzne track.id, hoci ide o rovnakú pesničku od rovnakého interpreta). Taktiež neodstránil rôzne „Remastered“ verzie alebo covery, pričom sa vždy snažil ponechať originálnu verziu. Keďže spoľahlivejší spôsob, ako tieto duplicity odstrániť skriptom, nebol zistený, proces prebiehal ručne. Navyše, niektoré skladby (najmä tie staršie) mali priradený nesprávny rok vydania, tak sa opravil aj ten.
Po prečistení datasetu v ňom ostalo 118 skladieb. Obsahuje tie najväčšie hity od Franka Sinatru či Justina Biebera, s rokom vydania začínajúcim rokom 1942 a končiacim v roku 2019. Skladby v datasete zahŕňajú umelcov ako Frank Sinatra či Justin Bieber, a prekvapivo aj Sia, ktorá vydala vianočný album. Najdlhšou skladbou je „You’re a Mean One, Mr. Grinch“ (Thurl Ravenscroft), ktorá trvá úctyhodných 5 minút a 16 sekúnd a jej verzia na Spotify obsahuje veľa hovoreného slova.
Keďže dát bolo stále málo, rozhodlo sa získať texty jednotlivých skladieb. S využitím Genius API bolo možné texty stiahnuť pomerne rýchlo. K niektorým textom skladieb sa cez Genius API nebolo možné dostať, čo si vyžiadalo dodatočné predspracovanie textov.
Analýza textov a sentimentu
Jedným z problémov pri analýze textov bolo odstrániť tzv. stopwords - slová, ktoré nenesú žiadny význam (napríklad the, a, but, and, or, what…). Najmenej unikátnych slov majú skladby „Ho Ho Ho“ (Sia) a „Holly Jolly Christmas“ (Michael Bublé) - po 30.
Asi nikoho neprekvapí, že najčastejším slovom, ktoré sa vyskytuje vo vianočných pesničkách, je slovo „Christmas“ - celkovo sa v 118 skladbách vyskytuje presne 833-krát (čo znamená, že v jednej pesničke sa priemerne vyskytuje 7-krát). Zaujímavosťou je, že v 26 vianočných pesničkách sa slovo „Christmas“ vôbec nevyskytuje! Ďalšie obľúbené slová sú „love“, „time“, „year“, „merry“, „snow“, „make“, „santa“, „like“, „baby“.
Pri analýze textov skladieb zaujala analýza sentimentu, kde slová môžu byť pozitívne, negatívne alebo neutrálne, a tiež analýza emócie textu. Väčšina slov je zaradená do kategórie (niektoré slová môžu byť vo viacerých kategóriách) podľa toho, akú emóciu v ľuďoch vyvoláva. Využil sa NRC lexicon, ktorý slová kategorizuje do desiatich kategórií: positive a negative, anger a anticipation, disgust a fear, joy a sadness, a surprise a trust.
V prvom kroku sa analyzovali slová všetkých pesničiek. Podľa očakávania sa na prvých piatich miestach objavili emócie positive, joy, anticipation, trust a surprise. Cieľom bolo určiť najšťastnejšie pesničky a zistiť, či by sa niektoré z nich dali označiť za smutné až depresívne, alebo či sú negatívne slová skôr rovnomerne rozložené naprieč skladbami.

Vianočné playlisty podľa dát
Celkovú pozitivitu skladby (christmasEndorphinIndex) sa určila ako priemer troch normalizovaných hodnôt - positiveWords, lyricalDensity a energy. PositiveWords je pomer medzi pozitívnymi slovami a všetkými slovami v pesničke (bez stopwords). LyricalDensity je pomer počtu slov v pesničke a jej času, čo vyjadruje počet slov za sekundu. Energy je metrika od Spotify, ktorá by mala predstavovať energické skladby.
Metriky lyricalDensity a energy boli do vzorca zahrnuté, pretože okrem pozitívnych slov by šťastná (joyful) vianočná pesnička mala byť aj vo veselom rýchlom tempe. Ak by pesnička obsahovala veľa pozitívnych slov, ale tempo a energia by boli nízke, pesnička by pôsobila skôr upokojujúco (napríklad „Tichá noc“). Tempo spievania vyjadruje metrika lyricalDensity a hudobné tempo metrika energy. Všetky tri metriky boli normalizované na hodnoty od 0 po 1.
Podobne sa postupovalo pri hľadaní negatívnych pesničiek, pre ktoré bol vytvorený ukazovateľ christmasDepressionIndex. Namiesto pozitívnych slov sa v metrike negativeWords zisťovala frekvencia výskytu negatívnych slov. V tomto prípade boli metriky lyricalDensity a energy znegované - tzn. ak mala pesnička menej slov za sekundu a bola menej energická, považovala sa za smutnejšiu. Vysoká frekvencia negatívnych slov a vysoké metriky energy a lyricalDensity by skôr implikovali hnev. Preto sa sústredilo na skladby s nízkou energy a lyricalDensity, ktoré evokujú smútok. Najsmutnejšou skladbou sa stala „You’re A Mean One, Mr. Grinch“ (Thurl Ravenscroft).
Najgýčovejšie vianočné skladby
V rámci analýzy sa definoval aj tzv. Christmas Cheese Ratio na určenie najgýčovejších a najneoriginálnejších vianočných skladieb. Christmas Cheese Ratio určuje, koľko percent z pesničky tvorí 20 najbežnejších slov vo vianočných skladbách. Ak je tento pomer väčší ako 33 % (viac ako tretina pesničky je tvorená najbežnejšie vyskytujúcimi sa slovami), skladba patrí do kategórie „gýčových“. Zaujímavosťou je, že v tomto playliste sa nachádzajú až tri pesničky od Mariah Carey.
Playlist pre tých, ktorým už Vianoc stačilo
Pre tých, ktorí by boli najradšej, keby Vianoce prešli čo najrýchlejšie, no nechcú kaziť radosť tým, ktorí sa na Vianoce tešili celý rok, bol vytvorený špeciálny playlist s názvom „Is it over yet?“. Tento playlist obsahuje 20 pesničiek, ktoré dokážu byť odohrané do 40 minút.
Analýza ukázala, že piesne ako „Wonderful Christmastime“ (Paul McCartney) a „Merry Xmas Everybody“ (Slade) neobsahujú slovo „Christmas“, ale len jeho variácie ako „Christmastime“.
Žaneta Baudyšová a jej vianočné skladby
Žaneta Baudyšová, umeleckým menom ZANA, sa folklóru venuje od detstva. V rokoch 1996 - 2002 pôsobila v detskom folklórnom súbore a následne vo folklórnom súbore Kamjana v Medzilaborciach, s ktorým sa zúčastnila domácich i zahraničných festivalov. Od roku 2016 pôsobí ako zakladateľka a umelecká vedúca folklórneho súboru Zavaran v obci Zavar. V rámci svojej činnosti sa zameriava na dokumentáciu a scénické spracovanie miestnych tradícií. V rokoch 2020 - 2025 viedla detský folklórny súbor Fándlyček pri ZŠ J. Fándlyho v Seredi.
#26 | Jan Kysučan: život s folklorem mezi VUS Ondráš a Strážnicí
Sólová tvorba a vianočné piesne
Sólovú hudobnú aktivitu začala Žaneta Baudyšová v závere roka 2024 zverejňovaním videoklipov na platforme YouTube. Následne vydala sériu videoklipov k moderným úpravám ľudových piesní, ako sú „A ja taká dzivočka“, „Čie sú to húsky“ či „Červené jabĺčko“. Medzi jej prvé autorské diela patrí skladba „Teším sa na Vianoce“, na ktorej spolupracovali David a Lukáš Baudyšovi. V rovnakom období vydala debutový štúdiový album Dzivočka, ktorý obsahuje 16 slovenských ľudových piesní v rockovom aranžmáne.
Žaneta Baudyšová zvečnila tradíciu natočením videoklipu k vianočnej koledy „Búvaj, dieťa krásne“. Jej verzia „Silent Night“ sa snaží priniesť nový pohľad na tento vianočný hit, čím oživuje čaro Vianoc. Speváčka ZANA tiež predstavila nový videoklip „Po nábreží koník beží“ ako úvodnú pieseň k jej novému albumu, ktorý je modernou verziou rovnomennej piesne.
