audio
All checks were successful
CI / Build thesis PDFs (pull_request) Successful in 1m5s
CI / Verify PDF/A (pull_request) Successful in 46s

This commit is contained in:
Oleg Petruny 2025-07-03 23:04:03 +02:00
parent eb13264035
commit fe906676ea
2 changed files with 8 additions and 1 deletions

View File

@ -179,6 +179,7 @@ Hlavní problém s~hudbou je~synchronizace linek. Hudba je~dost náchylná na~ja
\label{fig:musicLinking}
\end{figure}
\label{prg:fmod}
\paragraph{FMOD\protect\footnote{https://www.fmod.com/}} FMOD je middleware audio engine pro~hry poskytující velice silné rozhraní pro~práci se~zvuky nebo~jejich manipulaci. Nejčastěji se~k~němu přiklání pro~tvorbu dynamických hudebních doprovodů, což~vyplňuje hudební mezeru v~UE. V~populárních enginech má~integrovanou podporu nebo~poskytuje engine v~podobě samostatného procesu, který~potom může komunikovat s~procesem hry. FMOD~také poskytuje editor zvukových stop a~s~nimi spojených eventů, pro~jednoduché ovládání audia přímo ve~hře.
\subsection{Načítání obsahu}

View File

@ -343,9 +343,15 @@ Optimalizace audia nebyla mezi cíle této práce, avšak nějaký základní sy
\end{itemize}
V budoucnu by také pomohlo zabalit všechny hlasy a jiné audio do samostatných datových balíčků neboli chunků. Aktuálně všechny herní assety jsou automaticky zabalené do pár ucelených balíčků, což může vyvolát sice drobné zpomalení načtení assetů, ale stále kriticky ovlivnit audio zážítek.
\subsection{Kategorie a parametry audio assetů}
\subsection{Dynamický hudební doprovod}
Když mluvíme o dynamickém doprovodu ve hrách, často myslíme právě dynamické přepínání častí skladby v zavislostí na proměnných světa. Pří vývoji jsem se uchýlil k použítí zvukového enginu FMOD (viz \Cref{prg:fmod}) a hudbu jsem skládál sám bez použití samplů, tedy pomocí VST hudebních nástrojů. Častí hotové kompozice za účelem dynamičností měli by být nějakým způsobem nerušívě zacyklené, na což jsem kladl největší důraz. Bohužel kvůli omezenému času jsem nemohl věnovat dostatečnou pozornost rozmanitosti a komplexitě hudebních kompozic. Prototypy dynamického doprovodu lze již zaslechnout v průběhu třetí úrovně.
\subsection{Dabing dialogů}
Jelikož hra by měla poskytnout prostor pro AI generativní obsah, dialogy jsou již nadabováné pomoci AI. Na internetu je velký výběr model zdarma, které dokažou tvořit skvělé výsledky. Původně jsem začínal s python knihovnou Coque TTS, ale dosáhnout v něm aspoň dobrých výsledku bylo náročné. Proto jsem přešel na knihovnu a model Zonos, který již v základu poskytuje vyníkájící výsledky a navíc má prostředky pro udržování kontextu nebo parametry zabarvení hlasu.
V modulu VoiceGenerator v repozitáři hry je k dispozici skript na jednoduchou instalaci prostředi. Z časových důvodu jsem nestihl vytvořit skript, který by jednoduše generoval množiny resp. sekvence dialogů přímo z jednoho textového souboru. Aktuálně je potřeba ručně generovat každou větu jednotlivě přes webové rozhraní, které je součástí knihovny.
Ukázkové dialogy lze již zaslechnout v průběhu třetí úrovně. Původně jsem taky planoval vytvořit robotický hlas v třetí úrovní pomoci modifikace základního hlasu v novém pro UE5 zvukovém systému MetaSound. Ten dokáže komplexně modifikovat zvukový signal za běhu, ale na začlenění této technologie do hry nezbýval čas.
\section{Tipy při vývoji v UE}
\label{sec:UETips}