🗓️ Schedule

🕘 Time	📌 Event Description
09:00 - 09:20	Opening Remarks
09:20 - 10:00	Invited Talk: Cordelia Moore
10:00 - 10:30	Best Paper + Best Theme Paper
10:30 - 10:50	Break
10:50 - 11:30	Invited Talk: Francesco Barbieri (Meta)
11:30 - 12:10	Invited Talk: Kate Sim (COSPR)
12:10 - 13:40	Lunch Break
13:40 - 15:10	Poster Session
15:10 - 15:40	Lightning Talks
15:40 - 16:00	Break
16:00 - 17:00	Panel Discussion: Harms Beyond Hate Speech
17:00 - 17:10	Closing Remarks

📄 Proceedings

You can access the full proceedings of the workshop here (PDF).

🏆 Awards

🥇 Best Paper Award

Title: From civility to parity: Marxist-feminist ethics for context-aware algorithmic content moderation
Authors: Dayei Oh

🌟 Best Theme Paper Award

Title: Catching Stray Balls: Football, fandom, and the impact on digital discourse
Authors: Mark J. Hill

🖼️ Poster Presentations

A Comprehensive Taxonomy of Bias Mitigation Methods for Hate Speech Detection
Jan Fillies, Marius Wawerek, Adrian Paschke
Sensitive Content Classification in Social Media: A Holistic Resource and Evaluation
Dimosthenis Antypas, Indira Sen, Carla Perez Almendros, Jose Camacho-Collados, Francesco Barbieri
A Novel Dataset for Classifying German Hate Speech
Vincent Kums, Florian Meyer, Luisa Emily Pivit, Uliana Vedenina, Jonas Wortmann, Melanie Siegel, Dirk Labudde
Learning from Disagreement: Entropy-Guided Few-Shot Selection for Toxic Language Detection
Tommaso Caselli, Flor Miriam Plaza-del-Arco
Web(er) of Hate: A Survey on How Hate Speech Is Typed
Luna Wang, Andrew Caines, Alice Hutchings
Think Like a Person Before Responding: Persona-Guided LLMs for Countering Hate Speech
Mikel K. Ngueajio, Flor Miriam Plaza-del-Arco, Yi-Ling Chung, Danda Rawat, Amanda Cercas Curry
HODIAT: A New Dataset for Detecting Homotransphobic Hate Speech in Italian
Greta Damo, Alessandra Teresa Cignarella, Tommaso Caselli, Viviana Patti, Debora Nozza
Beyond the Binary: Analysing Transphobic Hate and Harassment Online
Anna Talas, Alice Hutchings
Evading Toxicity Detection with ASCII-art: A Benchmark of Spatial Attacks
Sergey A. Berezin, Reza Farahbakhsh, Noel Crespi
Debunking with Dialogue? AI-Generated Counterspeech for Conspiracies
Mareike Lisker, Christina Gottschalk, Helena Mihaljević
MisinfoTeleGraph: Misinformation Detection for German Telegram
Lu Kalkbrenner, Veronika Solopova, Steffen Zeiler, Robert Nickel, Dorothea Kolossa
Exploring Hate Speech Detection Models for Lithuanian Language
Justina Mandravickaitė, Eglė Rimkienė, Mindaugas Petkevičius, Milita Songailaitė, Eimantas Zaranka, Tomas Krilavičius
RAG and Recall: Multilingual Hate Speech Detection with Semantic Memory
Khouloud Mnassri, Reza Farahbakhsh, Noel Crespi
Implicit Hate Target Span Detection in Zero- and Few-Shot Settings
Hossam Boudraa, Benoit Favre, Raquel Urena
DETOXIFY-IT: An Italian Parallel Dataset for Text Detoxification
Viola De Ruvo, Arianna Muti, Daryna Dementieva, Debora Nozza
Pathways to Radicalisation: On Research for Online Radicalisation in NLP and ML
Zeerak Talat, Michael Sejr Schlichtkrull, Pranava Madhyastha, Christine de Kock
Social Hatred: Efficient Multimodal Detection of Hatemongers
Tom Marzea, Abraham Israeli, Oren Tsur
Blue-haired, misandriche, rabiata: Tracing the Connotation of ‘Feminist(s)’
Arianna Muti, Sara Gemelli, Emanuele Moscato, Emilie Francis, Amanda Cercas Curry, Flor Miriam Plaza-del-Arco, Debora Nozza
Towards Fairness Assessment of Dutch Hate Speech Detection
Julie Bauer, Rishabh Kaushal, Thales Bertaglia, Adriana Iamnitchi
Between Hetero-Fatalism and Dark Femininity: Discussions of the Femosphere
Emilie Francis
Can LLMs Rank the Harmfulness of Smaller LLMs?
Berk Atil, Vipul Gupta, Sarkar Snigdha Sarathi Das, Rebecca J. Passonneau
Are You Trying to Convince Me or Are You Trying to Deceive Me?
Ricardo Muñoz Sánchez, Emilie Francis, Anna Lindahl
Who leads? Who follows? Temporal Dynamics of Dogwhistles in Sweden
Max Boholm, Gregor Rettenegger, Ellen Breitholtz, Robin Cooper, Elina Lindgren, Björn Rönnerstrand, Asad Sayeed
Detecting Child Objectification on Social Media
Miriam Schirmer, Angelina Voggenreiter, Juergen Pfeffer, Agnes Horvat
Can Prompting LLMs Unlock Hate Speech Detection Across Languages?
Faeze Ghorbanpour, Daryna Dementieva, Alexandar Fraser
Multilingual Analysis of Narrative Characteristics in Conspiracist Telegram Channels
Katarina Laken, Matteo Melis, Sara Tonelli, Marcos Garcia
Hate Explained: Evaluating NER-Enriched Text in Human and Machine Moderation
Andres Carvallo, Marcelo Mendoza, Miguel Fernandez, Maximiliano Ojeda, Lilly Guevara, Diego Varela, Martin Borquez, Nicolas Buzeta, Felix Ayala
Online Misogyny Against Female Candidates in Brazil’s 2022 Elections
Luise Koch, Raji Ghawi, Jürgen Pfeffer, Janina Steinert
Technology-Facilitated Violence and Political Participation in Brazil
Luise Koch, Macarena Sfeir Sfeir, Thayná Yaredy, Angelina Voggenreiter, Janina Steinert
Beyond Generic Responses: Target-Aware Strategies for Countering Hate Speech
Yen-Yu Chang, Daryna Dementieva, Alexander Fraser
Civil Society in the Loop: Feedback-Driven LLM Monitoring Tool for Telegram
Milena Pustet, Elisabeth Steffen, Helena Mihaljevic, Grischa Stanjek, Yannis Illies
Monitoring Hate Speech in Indonesia: An NLP-based Classification
Musa Wijanarko, Lucky Susanto, Prasetia Pratama, Derry Tanti Wijaya, Ika Idris
Multi-Labeled Dataset for Indonesian Discourse: Toxicity & Polarization
Lucky Susanto, Musa Wijanarko, Prasetia Pratama, Zilu Tang, Fariz Akyas, Traci Hong, Ika Idris, Alham Fikri Aji, Derry Tanti Wijaya
A Survey of Antisemitism Research in NLP
Julia Mendelsohn, Karina Halevy, Chan Young Park, Maarten Sap, Yulia Tsvetkov
Alignment by Disagreement? LLM Adaptation to Toxicity Perception Variability
Pia Pachinger, Anna Maria Planitzer, Julia Neidhardt, Allan Hanbury, Sophie Lecheler
Personas with Attitudes: Controlling LLMs for Diverse Data Annotation
Leon Fröhling, Gianluca Demartini, Dennis Assenmacher
GAP: Optimizing Stealthy Jailbreak Prompt Generation for LLM Content Moderation
Daniel Schwarz, Dmitriy Bespalov, Zhe Wang, Ninad Kulkarni, Yanjun Qi
A Modular Taxonomy for Hate Speech Definitions
Matteo Melis, Gabriella Lapesa, Dennis Assenmacher
Using LLMs and Preference Optimization for Agreement-Aware HateWiC Classification
Sebastian Loftus, Adrian Mülthaler, Sanne Hoeken, Sina Zarrieß, Ozge Alacam
When Claims Evolve: Evaluating Embedding Robustness to Misinformation Edits (Findings of ACL)
Jabez Magomere, Emanuele La Malfa, Manuel Tonneau, Ashkan Kazemi, Scott A. Hale
Hatevolution: What Static Benchmarks Don’t Tell Us (Findings of ACL)
Chiara Di Bonaventura, Barbara McGillivray, Yulan He, Albert Meroño-Peñuela

⚡ Lightning Talks

Debiasing Static Embeddings for Hate Speech Detection
Ling Sun, Soyoung Kim, Xiao Dong, Sandra Kübler
Hate Speech in Times of Crises: a Cross-Disciplinary Analysis of Online Xenophobia in Greece
Maria Pontiki, Vasiliki Georgiadou, Lamprini Rori, Maria Gavriilidou
Hostility Detection in UK Politics: A Dataset on Online Abuse Targeting MPs
Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard
QGuard: Question-based Zero-shot Guard for Multi-modal LLM Safety
Taegyeong Lee, Jeonghwa Yoo, Hyoungseo Cho, Soo Yong Kim, Yunho Maeng
Anti-Phishing Layered Prompting (ALP): A Structured Few-Shot Approach to Enhance Webpage Phishing Detection
Atharva Bhargude, Ishan Gonehal, Chandler Haney, Dave Yoon, Kaustubh Vinn, Kevin Zhu
Red-Teaming for Uncovering Societal Bias in Large Language Models
Chu Fei Luo, Ahmad Ghawanmeh, Kashyap Coimbatore Murali, Bhimshetty Bharat Kumar, Murli Jadhav, Xiaodan Zhu, Faiza Khan Khattak