Research Publications

Academic contributions in Data Science, Machine Learning and Education Research

4 Publications
2 Journal Articles
1 Conference Papers
2026 Journal Article | Q1 GLSTSVM-CIL

Gravitational least squares twin support vector machine based on optimal angle for class imbalance learning

Abdullah Mohammadi, Jalal A. Nasiri, Sohrab Effati
Journal of Applied Mathematics and Computation 510 (2026) 129705
Twin SVM Optimal angle Gravitational LSTSVM Class Imbalance Learning Large scale data
View Paper (DOI)

ABSTRACT

This paper introduces the Gravitational Least Squares Twin Support Vector Machine for Class Imbalance Learning (GLSTSVM-CIL), a novel binary classification method designed to address critical limitations in existing approaches for imbalanced large-scale datasets. Traditional methods like Fuzzy TSVM and KNN-based weighting fail to simultaneously capture both global positional relationships and local density characteristics of data points. Our proposed gravitational weighting function innovatively models data samples as masses influenced by their distance from class centroids and neighborhood density, effectively prioritizing representative points while suppressing outliers. The optimization framework uniquely incorporates angular constraints between hyperplanes to enhance structural risk control and generalization capability. For scalability, we reformulate the solution into a linear system solvable via conjugate gradient methods, avoiding computationally expensive matrix inversions. Comprehensive evaluations on 92 datasets (including synthetic, noisy, medical, text, and large-scale NDC benchmarks) demonstrate GLSTSVM-CIL’s superior performance, particularly in minority-class recognition where it achieves average F1-Score improvements over baseline methods. The model maintains robust Accuracy under high noise (20 %) and extreme class imbalance (ratio 20:1) while ables to process datasets up to 50,000 samples.

1404 Expository Article | Persian Education

از تصمیم‌سازی تا طرحواره‌سازی: تلفیق ساخت و ساز گرایی، تصمیم‌سازی و طرحواره‌های ذهنی در آموزش ریاضی

From decision-making to schema-building: Combining constructivism, decision-making, and mental schemas in mathematics education to enhance mathematics teaching and learning

عبدالله محمدی
آموزش ریاضی ساخت گرایی تصمیم‌سازی طرحواره‌های مفهومی
به سوی علوم ریاضی، دوره 5، شماره 1
مشاهده مقاله

چکیده

این مقاله با هدف ارائه‌ی سبک تدریس نوین در آموزش ریاضی، به تحلیل تعامل پویای سه مؤلفه‌ی کلیدی ساخت‌وسازگرایی و طرحواره‌های می‌پردازد. بر اساس یافته‌ها، آموزش تصمیم‌سازی، به‌عنوان فرایند طراحی گزینه‌ها، تحلیل شرایط و ارزیابی پیامدها پیش از تصمیم‌گیری، در بستر ساخت‌وسازگرایی، نقشی محوری در شکل‌گیری طرحواره‌های انعطاف‌پذیر شناختی ایفا می‌کند. مدل مفهومی پیشنهادی نشان می‌دهد که معلم با طراحی موقعیت‌های تعارض‌برانگیز و مسئله‌محور در «منطقه‌ی رشد تقریبی»، دانش‌آموزان را به انتخاب آگاهانه‌ی راهبردها، بازخوردگیری فعال و بازسازی راه‌حل‌ها ترغیب می‌کند. این فرایند نه‌تنها درک رابطه‌ای مفاهیم (در مقابل درک ابزاری) را تقویت می‌کند، بلکه از طریق سناریوهایی مانند انتخاب روش حل، تحلیل خطا و طراحی مسئله، به شکل‌گیری طرحواره‌های پایدار و انتقال‌پذیر می‌انجامد. گزارش تجربه‌ی عملی در کلاسِ باانگیزه‌ی پایین، مؤید کارایی این چارچوب در افزایش خودکارآمدی، تفکر انتقادی و مسئولیت‌پذیری دانش‌آموزان است.

1403 Master Thesis | Persian Machine Learning

ماشین بردار پشتیبان دوقلو برای داده های نامتوازن

Twin Support Vector Machines for Imbalanced Data

عبدالله محمدی
یادگیری ماشین ماشین بردار پشتیبان دوقلو داده‌های نامتوازن گرانش جاذبه زاویه بهینه بردار نرم ابرصفحه
پایان‌نامه کارشناسی ارشد، دانشگاه فردوسی مشهد
مشاهده

چکیده

الگوریتم‌های برپایه‌ی ماشین‌های بردار پشتیبان یکی از روشهای قدرتمند در طبقه بندی داده هاست. روش استاندارد ماشین بردار پشتیبان با جستجوی دو ابرصفحه‌ی موازی داده‌ها را طبقه بندی می‌کند. روش توسعه یافته‌ی آن، ماشین بردار پشتیبان دوقلو ابرصفحه‌هایی را می‌یابد که لزوما موازی نیستند. در دو مورد قبل، تمام نمونه‌های مورد مطالعه در تعیین ابرصفحه ها دارای ارزش برابر هستند، اما داده‌های دورافتاده، داده‌های نزدیک به مرکز کلاس و یا داده‌هایی که در اطراف آن‌ها تجمع بیشتری وجود دارد، دارای اهمیت متفاوتی از لحاظ میزان تعلق به کلاس و تعیین ابرصفحه‌ها هستند. در واقع، تجمع و فاصله دو ویژگی بسیار مهم در تشابه نقاط است. نوع دیگر، مجموعه‌هایی هستند که در یک کلاس تعداد اندک و در کلاس دیگر تعداد خیلی زیادی از نمونه ها را شامل می‌شوند. در چنین مجموعه‌هایی، با استفاده از نسبت عدم تعادل، از سوگیری ابرصفحه ها به سمت کلاس بزرگتر جلوگیری می شود. داده‌های بیماری‌ها از این نوعند. در دنیای واقعی مانند داده‌های بیماری‌ها، علاوه بر برقراری تعادل در بین دو کلاس، تشخیص درست نمونه‌ها در کلاس کوچکتر اهمیت بیشتری دارد. در این پژوهش بر اساس تجمع و فاصله نمونه‌ها از مرکز کلاس، تابعی تعریف می‌شود که قادر است براساس چگالی و فاصله از مرکز کلاس، میزان اهمیت نقاط را اندازه گیری کند، بنابراین اهمیت نمونه ها از ترکیب چگالی اطراف و موقعیت مکانی به درستی کشف می‌شود. سپس مسئله بهینه سازی درجه‌ی دوی روشهای پیشین، به یک مسئله‌ی خطی بدون قید تبدیل می شود. و با استفاده از گرادیان مزدوج توانایی روش در برابر داده‌های بسیار بزرگ افزایش داده می شود. و در نهایت نتایج پژوهش روی انواع مختلفی از داده آزموده شده و انتظار می رود نتایج بهتر و مطمئن تری نسبت به روشهای پیشین بدست آوریم.

1402 Conference Paper | Persian Healthcare

پیش بینی بیماری های مزمن با داده های نامتوازن توسط ماشین بردار پشتیبان گرانشی

Prediction of Chronic Diseases with Imbalanced Data using Gravitational Support Vector Machines

عبدالله محمدی، جلال الدین نصیری، سهراب عفتی
مدل وزنی وزن گرانشی ماشین بردار پشتیبان بیماری‌های مزمن دیابت آلزایمر سرطان
پنجمین کنفرانس ملی انفورماتیک ایران
مشاهده مقاله

چکیده

با پیشرفت تکنولوژی، روش‌های مبتنی بر داده برای تشخیص انواع بیماری ها، به طور گسترده‌ای مورد توجه قرار گرفته ‌است. در طبقه بندی بیماری ها، تشحیص درست فرد ناسالم نسبت به تشخیص درست یک فرد سالم از اهمیت بیشتری برخودار است. اغلب داده های این بیماری ها دارای جامعه ی بیمار کوچک و جامعه ی سالم بزرگتری است. در این مقاله با تعریف یک تابع وزن ویژه در مدل وزنی الگوریتم twin svm ، نشان داده می شود اختصاص وزن به گروه کوچکتر می تواند در تشخیص طبقه ی نمونه ها موثرتر باشد، ابتدا مفاهیم پایه ای مدل را بیان نموده سپس علاوه بر روال الگوریتم های دیگر، برای داده های کلاس کوچکتر نیز وزن اختصاص داده می شود. سپس از چندین مجموعه داده ی بیماریهای مزمن مانند سرطان، دیابت و آلزایمر و ...، برای ارزیابی عملکرد روش استفاده نموده با مقایسه ی نتایج با چند روش دیگر، نشان داده می شود روش مورد استفاده می‌تواند با دقت بهتری نمونه ها را طبقه بندی کرده، نمونه های کلاس کوچکتر را نیز با دقت بالاتری تشخیص دهد بنابراین می توان انتظار داشت بر روش‌های دیگر برتری داشته باشد.