Efficient Context Filtering for Extractive Question Answering: A Hybrid Approach with Semantic Validation

Vahid Ghanbarizadeh; Amin Moeinian; Zahra Younes Pour Langaroudi; Mohsen Mohammadagha; Athar Sharifi

doi:10.32996/jcsts.2026.8.2.1

Research Article

Efficient Context Filtering for Extractive Question Answering: A Hybrid Approach with Semantic Validation

Authors

Vahid Ghanbarizadeh Florida Atlantic University (FAU), Boca Raton, USA https://orcid.org/0009-0005-1249-1972
Amin Moeinian HEC Montreal, Montreal, Canada https://orcid.org/0000-0002-0151-1836
Zahra Younes Pour Langaroudi University of Trieste, Trieste, Italy https://orcid.org/0009-0007-6946-366X
Mohsen Mohammadagha University of Texas at Arlington, Texas, USA https://orcid.org/0009-0007-0394-353X
Athar Sharifi Padua University, Padua, Italy https://orcid.org/0009-0000-4265-2144

Abstract

Extractive question answering on lengthy documents remains computationally expensive due to quadratic attention complexity and context truncation requirements in modern language models. This work proposes a hybrid context filtering framework that combines classical similarity metrics, including cosine similarity and Word Mover’s Distance, with the Bitap algorithm, and utilizes selective LLM-based validation to reduce inference cost while maintaining competitive accuracy. The method filters irrelevant sentences before passage encoding, thereby reducing computational overhead without requiring learned retrieval components. Evaluation on SQuAD 2.0 across four open-source models (Llama 2 8B, T5-3B, Flan-T5-XL, mT5-Base) using 5-shot learning and fine-tuning demonstrates a 2.3 inference speedup and 58% latency reduction with a modest accuracy trade-off of 5.7% relative F1 degradation compared to full-context baselines. Component ablation confirms the synergistic contribution of each similarity metric, while robustness evaluation across various context lengths and out-of-distribution settings validates the method’s generalization capabilities. These results indicate that intelligent, parameter-free context filtering can achieve meaningful computational efficiency without necessitating complex learned retrievers.

Article information

Journal

Journal of Computer Science and Technology Studies

Volume (Issue)

8 (2)

DOI

https://doi.org/10.32996/jcsts.2026.8.2.1

Pages

01-09

Published

2026-01-25

How to Cite

Ghanbarizadeh, V., Moeinian, A., Younes Pour Langaroudi , Z., Mohammadagha, M., & Sharifi, A. (2026). Efficient Context Filtering for Extractive Question Answering: A Hybrid Approach with Semantic Validation. Journal of Computer Science and Technology Studies, 8(2), 01-09. https://doi.org/10.32996/jcsts.2026.8.2.1

Journal of Computer Science and Technology Studies

Efficient Context Filtering for Extractive Question Answering: A Hybrid Approach with Semantic Validation

Authors

Abstract

Article information

Journal

Journal of Computer Science and Technology Studies

Volume (Issue)

8 (2)

DOI

https://doi.org/10.32996/jcsts.2026.8.2.1

Pages

01-09

Published

How to Cite

Downloads

119

107

Keywords:

rightbar

submission

menus