SEG_TOOL (2019)

Einleitung

Das SEG_TOOL wurde entwickelt, um die Frage zu beantworten: "Kann eine akustische Sequenz auf Phonebene segmentiert werden?" Die Arbeit von Machelett (1996) legt nahe, dass Segmentgrenzen im Spektrogramm visuell erkennbar sind. Unser Tool zielt darauf ab, diese Segmentgrenzen ohne visuellen Input automatisiert zu erkennen, indem es Formantwerte als Datenbasis nutzt. Diese README bietet eine detaillierte Anleitung zur Nutzung des Tools und beschreibt die technischen Details seiner Implementierung.

Ein Beispiel wie die Transkription manueller Art funktioniert und die Idee hinter dem Seg-Tool:

Übersicht

Einleitung
Installation
Nutzung
Programmierung des SEG_TOOLs
- Klassenstruktur
- Analysestruktur
Datenverarbeitung
Ausgabe der Daten
Beispiele
Fazit

Installation

Voraussetzungen:
- Java Development Kit (JDK)
- Eclipse IDE oder eine andere Java-Entwicklungsumgebung
Schritte:
- Klonen oder Herunterladen des Projekts.
- Importieren des Projekts in Ihre Java-IDE.
- Sicherstellen, dass alle Abhängigkeiten korrekt installiert sind.

Nutzung

Starten Sie das SEG_TOOL in Ihrer IDE.
Wählen Sie die Datei Formantenanalyse.txt über das Auswahlfenster aus.
Das Tool analysiert die Datei und erstellt automatisch die Segmentierungsgrenzen.
Überprüfen Sie die Ausgabedateien (TextGrid und CSV) für die Ergebnisse.

Programmierung des SEG_TOOLs

Klassenstruktur

Datensatz: Repräsentiert das gesamte Dokument Formantenanalyse.txt. Enthält Attribute wie xmin, xmax, nx, dx, x1 und eine Liste von Frame-Objekten.
Frame: Jedes Frame-Objekt enthält einen Intensitätswert und eine Liste von Formant-Objekten.
Formant: Jedes Formant-Objekt enthält Frequenz- und Bandbreitenwerte.
Loesungssatz: Enthält eine Liste von Trennstelle-Objekten.
Trennstelle: Enthält die Position und Kennwerte einer Segmentierungsgrenze.

Analysestruktur

Analyzer: Die Hauptklasse zur Datenverarbeitung.
- Einlesen & Aufbereiten der Daten: Datei wird eingelesen und Inhalte werden in eine ArrayList geschrieben und aufbereitet.
- Kernanalyse: Besteht aus drei Schritten:
  1. Kennwerte definieren: Berechnung der Kennwerte für jeden Frame.
  2. Kennwerte über Frames analysieren: Berechnung der Differenzen zwischen den Frames und Identifikation vorläufiger Trennstellen.
  3. Treffer eingrenzen: Analyse der Streuung und Identifikation der endgültigen Trennstellen.

Datenverarbeitung

Einlesen & Aufbereiten der Daten

Einlesen: Die Datei Formantenanalyse.txt wird zeilenweise eingelesen und in eine ArrayList geschrieben.
Aufbereiten: Inhalte werden in Präfixe und Suffixe aufgeteilt und in ein Datensatz-Objekt geschrieben.

Kernanalyse – Verarbeitung der Daten

Kennwerte definieren:
- freqband: Gemittelter Wert der Formanten in Hinblick auf Frequenz und Bandbreite.
- Intensity: Maximale Lautstärke eines Frames.
- Einzelne Formantenkennwerte (F1F, F2F, F1B, F2B).
Kennwerte über Frames analysieren:
- Berechnung der Differenzen (werte_diff).
- Verrechnung der Differenzen mit den maximalen Werten (daten_max).
- Anwendung von Konstanten und Bedingungen zur Identifikation vorläufiger Trennstellen.
Treffer eingrenzen:
- Analyse der Streuung von vorläufigen Trennstellen.
- Identifikation der endgültigen Trennstellen basierend auf definierten Bedingungen (z.B. kleinster freqband-Wert innerhalb eines Intervalls).

Ausgabe der Daten

TextGrid-Datei: Enthält die Trennstellen mit Zeitpunkten, um sie visuell in Tools wie PRAAT zu überprüfen.
CSV-Datei: Enthält die Kennwerte und die Positionen der Trennstellen zur weiteren Analyse in Tools wie Excel.

Beispiele

Anwendungsbeispiel: Analyse einer Beispiel-Datei Formantenanalyse.txt und Überprüfung der Ergebnisse in PRAAT.
Ergebnisverbesserung: Anpassung der Konstanten und Bedingungen, um die Segmentierungsergebnisse zu optimieren.

Fazit

Das SEG_TOOL bietet eine automatisierte Möglichkeit, akustische Sequenzen auf Phonebene zu segmentieren, basierend auf Formantwerten. Es ist flexibel und erweiterbar, sodass verschiedene Analyseparameter und Bedingungen angepasst werden können, um optimale Ergebnisse zu erzielen. Die Ausgabeformate ermöglichen eine einfache Überprüfung und Weiterverarbeitung der Ergebnisse.

Mit dieser README sind Sie bestens gerüstet, um das SEG_TOOL effektiv zu nutzen und weiterzuentwickeln. Für weitere Informationen und technische Details konsultieren Sie bitte die vollständige Dokumentation im Anhang Ihrer Projektdateien.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
bin		bin
data		data
docs		docs
src		src
.classpath		.classpath
.gitignore		.gitignore
.project		.project
Gerlach_HA_Textverarbeitung.pdf		Gerlach_HA_Textverarbeitung.pdf
README.md		README.md
SEG_TOOL.pptx		SEG_TOOL.pptx

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SEG_TOOL (2019)

Einleitung

Übersicht

Installation

Nutzung

Programmierung des SEG_TOOLs

Klassenstruktur

Analysestruktur

Datenverarbeitung

Einlesen & Aufbereiten der Daten

Kernanalyse – Verarbeitung der Daten

Ausgabe der Daten

Beispiele

Fazit

About

Uh oh!

Releases

Packages

Languages

AnneGerlach/seg_tool

Folders and files

Latest commit

History

Repository files navigation

SEG_TOOL (2019)

Einleitung

Übersicht

Installation

Nutzung

Programmierung des SEG_TOOLs

Klassenstruktur

Analysestruktur

Datenverarbeitung

Einlesen & Aufbereiten der Daten

Kernanalyse – Verarbeitung der Daten

Ausgabe der Daten

Beispiele

Fazit

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages