همبستگی کاذب و خاصیت بسته بودن دادههای ترکیبی در علوم زمین
محورهای موضوعی :
1 - دانشگاه کاشان
کلید واژه: دادههای ترکیبی و خاصیت بسته بودن آنها, تبدیلهای لگاریتم نسبتی, روشهای آماری استوار , همبستگی کاذب ,
چکیده مقاله :
دادههای ترکیبی که معمولا نتیجه اندازهگیریها در علوم زمین هستند، خاصیت مهمی به نام بسته بودن دارند. پژوهشگرانی که بدون توجه به این خاصیت، از روشهای متداول آماری با اعمال تبدیل لگاریتمی برای تعدیل چولگی و یا نرمالکردن دادهها استفاده میکنند در واقع وجود همبستگی کاذب در دادههای ترکیبی را نادیده میگیرند که این باعث نتایج آماری نادرست میشود. در این مقاله بعد از معرفی دادههای ترکیبی و خاصیت بسته بودن آنها، تبدیلهایی برای باز کردن سیستم بسته دادهها معرفی شدهاند. این تبدیلها عبارتاند از تبدیل نسبت لگاریتمی جمعی، تبدیل نسبت لگاریتمی مرکزی شده و تبدیل نسبت لگاریتمی ایزومتریک که همگی برحسب لگاریتم نسبتها تعریف میشوند. بعد از معرفی و برشمردن مزایا و معایب این تبدیلها نسبت به همدیگر، یکی از آنها به نام تبدیل clr روی یک مجموعه داده مربوط به آنالیز شیمیایی خاک اعمال شده است. بعلاوه نتایج اعمال تحلیل خوشهای بر دادههای تبدیل شده با استفاده از ماتریس ضرایب همبستگی اسپیرمن به عنوان ماتریس فاصله مورد بررسی قرار گرفته است. همچنین تأثیر اعمال تبدیل clr بر حذف همبستگی کاذب، تعدیل چولگی و نقاط پرت در دادهها با کمک برخی نمودارهای آماری و با استفاده از نرمافزار آماری R بررسی شده است.
In earth sciences, measurements usually produce compositional data with a property called closedness. Researchers who use common statistical methods on compositional data ignore spurious correlations, which causes incorrect results. This article introduces transformations for opening closed system of compositional data. These transformations include the additive logarithmic ratio (alr), the centred logarithmic ratio (clr), and the isometric logarithmic ratio (ilr). They are all defined in terms of logarithms of ratios. We then applied the clr transformation to a soil chemical data set. We also analysed the results of applying cluster analysis on the clr transformed data using Spearman's correlation coefficient matrix as distance. We also investigated how applying clr transformation affects spurious correlation, skewness and outliers in the data using R statistical software.
- اعلمی نیا، ز.، منصوری اصفهانی، م.، طباطبايی، س. ح. و بختیاری، ن. م.، 1397. شناسایی و پیجویی ناهنجاریهای زمینشناسی همراه با کانیسازی مس در چهارگوش 1:100000 نطنز (شمال اصفهان)، ایران. بلورشناسی و کانیشناسی ایران، (۳)26، 625-634.
- حسین پور نجاتی، س.، سیاه چشم، ک.، علوی، س. غ.، زرگری، پ.، ۱۴۰۰. تحلیل پتانسیل کانیزایی با استفاده از روش تحلیل فاکتوری مرحلهای (SFA) در گستره خوشنامه، هشجین، استان اردبیل. فصلنامه زمینشناسی ایران، 57، 13-1.
-حیدریان دهکردی، ن.، توکل، م. ح.، پورمحمدی، س.، 1396. پتانسیل سنجی رسوبات آبراههای منجیل با استفاده از GIS . فصلنامه زمینشناسی ایران، 43، 108-95.
-محمدی اصل، ز.، سعيدی، ع.، آرین، م.، سلگي ع.، فرهادي نژاد، ط.، ۱۳۹۹. جداسازي آنوماليهاي ژئوشيميايي از زمينه با استفاده از روش فرکتالي عيار-تعداد در محدوده وشنوه (جنوب قم). فصلنامه زمینشناسی ایران، 53، 73-61.