BERT

GenreClassifcation_BERT_v2

key difference

Download dataset directly from Kaggle
Fully connected classifier using CLS token
Undersampling / Oversampling / Class Weights for extremely imbalanced data
Improved validation and visualization

Metrics

Scenario 1: Undersampling	Scenario 2: Oversampling	Scenario 3: Class Weights

Summary

Undersampling showed to be most effective and efficient strategy for improving performance on minority classes in such extremely imbalanced dataset.
Class weights provided efficient improvements for majority classes.
Oversampling was neither effective nor efficient, since it gave no meaningful benefit over class weights while wasting computation resources on oversampled duplicates.

Total running time (T4 GPU): preprocessing (3 min) / Scenario 1 (1h) / Scenario 2 (2h) / Scenario 3 (1.5h)

Genre classification by lyrics with word2vec embedding.

Code

Genre classification with BERT embedding and LSTM classifier.
Test Demo of genre classification with BERT embedding and LSTM classifier.
Simple implementation of CNN classifier.
Utils.py (for saving model and downsampling dataset)
utils.py

Reference

Huggingface main : Huggingface
Huggingface hub usage :

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
README_image		README_image
GenreClassification_BERT.ipynb		GenreClassification_BERT.ipynb
GenreClassification_BERT_CNN.ipynb		GenreClassification_BERT_CNN.ipynb
GenreClassification_BERT_Demo.ipynb		GenreClassification_BERT_Demo.ipynb
GenreClassification_BERT_v2.ipynb		GenreClassification_BERT_v2.ipynb
README.md		README.md
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BERT - Revision 2025

Metrics

Summary

BERT

Code

Reference

About

Uh oh!

Releases

Packages

Languages

Stone-bridge-NLP/BERT

Folders and files

Latest commit

History

Repository files navigation

BERT - Revision 2025

Metrics

Summary

BERT

Code

Reference

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages