صنعت حمل و نقل آنلاین: به گزارش سازمان جهانی گردشگری در 60 سال گذشته میزان گردشگر ورودی خارجی بیش از 4 هزار درصد افزایش یافته و در سال 2015 میلادی به 1.2 میلیارد نفر رسیده است، به طوری که مقصدهای گردشگری و فراهمآوران خدمات به پیشبینی دقیق تقاضای گردشگری نیاز شدیدی دارند زیرا این روند افزایشی همچنان ادامه دارد و با پدیدهای ایستا سر و کار نداریم.
گردشگری یکی از مهمترین بخشهای کسب و کار است و 7 درصد کل صادرات جهان را در اختیار دارد و همچنان بازار رو به رشدی است. منظور از گردشگری ورودی آن نوع از گردشگری است که فردی بیگانه به کشور مورد نظر سفر کند و نیز در تقابل با گردشگری خروجی قرار دارد مانند فردی که از کشور خودمان به کشوری خارجی سفر کند.
گردشگری ورودی با آن که از روندهایی درازمدت پیروی میکند، دارای روندهای فصلی نیرومندی هم هست. یعنی در فصول مختلف سال روند خاص خودش را دارد. از این رو پیشبینی تقاضای آتی گردشگری بر اساس میزان گردشگری ورودی در گذشته به طور معمول نتایج رضایتبخش و کاربرد گستردهای در گردشگری داشته است. اما تقاضای گردشگری و به خصوص گردشگری ورودی بینالمللی به شدت متأثر از عوامل خارجی مثل عوامل اقتصادی از قبیل نرخ ارز و درآمد مصرفکنندگان یا عوامل خاص مقصد از قبیل فعالیتهای بازاریابی در مقصد هم هست. افزون بر این کاربری فزاینده اینترنت در میان گردشگران برای گردآوری اطلاعات و شناسایی ردپای الکترونیکی چنین کاربرانی میتواند منابع اطلاعاتی جدید و نویدبخشی باشد و دقت پیشبینی تقاضا را افزایش دهد تا بتوان با نوسانات غیرعادی تقاضا بر اثر رویدادهای بزرگ مواجه شد. بنابراین این گونه منابع اطلاعات خارجی و مبتنی بر اینترنت که در اغلب موارد کلانداده نامیده میشوند، ورودیهای دیگر برای بهکرد پیشبینی تقاضای گردشگری هستند.
منظور از کلان داده نیز دادههایی است که چنان بزرگ و پیچیده هستند که برنامههای کاربردی سنتی برای پردازش آنها کفایت نمیکند. تحلیل، برداشت، جستجو، اشتراکگذاری، ذخیرهسازی، انتقال، نمایش، روزآوری و حفظ حریم این اطلاعات بسیار پرچالش است.
مشخصات دادهگان
- میزان گردشگر ورودی: شمار گردشگران ورودی خارجی به مقصد مورد نظر در هر ماه و کشوری که از آن میآیند.
- درآمد: میزان تولید ناخالص داخلی(جیدیپی) کشورهایی که گردشگران مورد نظر از آن جا میآیند به عنوان شاخص درآمد هر گردشگر که اثر چشمگیری بر تقاضای گردشگری دارد.
- تراز قیمت در مقصد: گردشگران به طور معمول میزان هزینهها در مقصد (بر اساس ارز کشور مقصد) را مبنای تصمیمگیریهای مسافرتی خود قرار میدهند. تراز قیمت برای گردشگران خارجی را با نسبت شاخص قیمت مصرفکننده (سیپیآی) در کشور مقصد محاسبه میکنند. در واقع سیپیآی قیمت متوسط مجموعهای از کالاها و خدمات مصرفی مثل مواد غذایی و خدمات پزشکی را مشخص میکند.
- تراز قیمت در مقصدهای دیگر: تراز قیمت در مقصدهای رقیب بر کشش قیمت تقاضای گردشگری اثر میگذارد و به روشی مشابه روش محاسبه تراز قیمت در مقصد آن را محاسبه میکنند.
- هزینههای حمل و نقل: هزینههای حمل و نقل سهم چشمگیری از کل بودجه مسافرت است و بر تصمیمگیریهای مسافرتی اثر میگذارد. در گردشگری بینالمللی حملونقل هوایی اهمیت زیادی دارد که خود متأثر از قیمت جهانی سوخت هواپیما و در نتیجه قیمت جهانی نفت است.
- هزینههای تبلیغات: مخارج تبلیغات بر تقاضای گردشگری اثر دارد و دادههای سالانه آن را در محاسبات دخالت میدهند.
- اثر فصلهای مختلف و رویدادهای مهم: رویدادهای مهم فصول مختلف از قبیل مسابقات ورزشی هم بر تقاضای گردشگری اثر مهمی میگذارند. برای مثال مسابقات جام باشگاههای اروپا میتواند میزان گردشگری ورودی در شهرهای میزبان را به طور چشمگیری افزایش دهد.
برای مثال در شکل زیر میزان ورود گردشگران دانمارکی به نواحی کوهستانی سوئد و میزان جستجوهای اینترنتی آنها به نمایش در آمده است که به وضوح نشان میدهد بین شمار جستجوی اطلاعات مناطق کوهستانی سوئد در گوگل و میزان ورود گردشگران دانمارکی همبستگی نیرومندی وجود دارد. یعنی میزان جستجو در گوگل میتواند منبع کلاندادهای بسیار خوبی برای افزایش دادن دقت پیشبینی تقاضا باشد.
در شکل زیر هم اثر قیمت سوخت هواپیما بر میزان ورود گردشگران دانمارکی به مناطق کوهستانی سوئد به تصویر کشیده شده است. همان طور که مشخص است افزایش قیمت سوخت هواپیما در دوره 2007 تا 2008 کاهش ورود گردشگری در فاصله 2008 تا 2009 را به دنبال داشته و کاهش شدید قیمت سوخت هواپیما در سال 2009 افزایش چشمگیر ورود گردشگر در سال 2010 را در پی داشته است.
در هر دو مورد بین عامل اثرگذار و میزان گردشگری ورودی مقداری پسافت زمانی وجود دارد که دخیل کردن آن در محاسبه اهمیت زیادی دارد.
در روش سنتی خود-وایاز(Autoregressive) برای پیشبینی از دادههای ورودی گذشته برای پیشبینی ورودیهای آینده استفاده میکنند و پسافتهای زمانی مختلف را هم در نظر میگیرند. پسافت زمانی در سایر عوامل پیشگفته مثل مخارج تبلیغاتی هم دخالت دارد.
اما در اکثر روشهای دادهکاوی ( شبکههای عصبی مصنوعی، درختوارههای تصمیمگیری و نزدیکترین همسایه) بر خلاف روش وایازی خطی نیازی نیست که ویژگیهای آماری خاصی مثل غیر همخطی بودن خصیصههای ورودی برای دادهگان درست باشد. یعنی میتوان در تدوین الگوی پیشبینی، برای تمام پسافتهای زمانی در گستره زمانی مورد نظر، خصیصههای ورودی را در دادهگان گنجاند. اندازه گستره زمانی را باید به دقت برگزید تا تمام روندها و الگوهای مهم را در برگیرد. مثلاً گستره زمانی 24 ماه میتواند با ویژگی موسمی بودن و روندهای چندساله به خوبی سازگار باشد.
روش سنتی وایازی خطی: رهیافت آماری وایازی خطی برای پیشبینی میزان گردشگران ورودی بسیار مناسب است. در این روش برای آن که از در نظرگیری خصیصههای ورودی غیر مهم یا دارای همبستگی شدید در الگوی وایازی جلوگیری شود (بر اثر درنظرگیری خصیصههای دارای پسافت زمانی مختلف) از گزینش پیشسو برای الگوسازی دادهای استفاده میکنند و مادامی که افزایش کارایی از پیش تعریفشدهای قابل حصول باشد افزایش مهمترین خصیصهها تداوم دارد.
روش kنزدیکترین همسایه(k-NN): در الگوریتم k-NNخصیصه هدف هر مدخل دادهای جدید را بر اساس تعداد شبیهترین مدخل دادهای در مجموعه دادهگان برآورد میکنند که با k نشان داده میشود. در مورد پیشبینی میزان گردشگر ورودی بر اساس گسترههای زمانی، این الگوریتم شمار گردشگران ورودی در زمان t را بر اساس نقاط زمانی گذشته که دارای شبیهترین مقادیر خصیصه ورودی در گستره زمانی مربوطه هستند برآورد میکند.
کارایی دو روش فوق را میتوان با اعتبارسنجی از طریق گسترههای زمانی متغیر مورد سنجش قرار داد. که در مورد پیشبینی میزان گردشگران ورودی دانمارک به نواحی کوهستانی سوئد در جدول زیر آمده است.
روش پیشبینی | کشور مبداء گردشگران | روش خود-وایاز | روش کلانداده | ||
RMSE | MAE | RMSE | MAE | ||
خود-وایاز خطی | دانمارک | 1320.27 | 753.20 | 553.37 | 413.96 |
k-NN | دانمارک | 812.10 | 509.15 | 653.32 | 360.06 |
MAE:میانگین خطای مطلق
RMSE:خطای جذر میانگین مربعات
با مقایسه دو روش تخمین مشخص است که در هر دو روش افزودن منابع اطلاعات دادهای کلان به عنوان ورودی اضافی میتواند کارایی پیشبینی را به گونه چشمگیری افزایش دهد و این افزایش در روش سنتی خیلی بیشتر است. متوسط MAE برای روش پیشبینی k-NN به میزان 30 درصد کاهش داشته است. بنابراین میتوان گفت منابع اطلاعات کلاندادهای میتوانند دقت پیشبینی گردشگری ورودی را در مقایسه با روش سنتی به میزان چشمگیری افزایش میدهد.
افزون بر این، استفاده از منابع اطلاعات کلاندادهای سبب میشود در هنگام بروز رویدادهای بزرگ هم بتوان میزان گردشگری ورودی را تخمین زد. وقتی تغییری خارقالعاده رخ دهد مثلاً نرخ ارز یا هزینه حمل و نقل به شدت تغییر کند یا رویداد ورزشی بزرگی یا بحرانی طبیعی رخ دهد روش مبتنی بر کلاندادهها خیلی کارآمدتر از روش سنتی است. بنابراین در موقعیتهای غیرعادی، پیشبینی مبتنی بر کلاندادهها میتواند پشتوانه ای باارزش برای تصمیمگیری در حوزه گردشگری باشد. در واقع روش جدید به طور کامل گوی سبقت را از روش سنتی میرباید.
تحقیقات کنونی محدود به شمار محدودی از منابع اطلاعات کلاندادهای است که دادههای روندنمای گوگل معروفترینشان است اما در مطالعات آینده باید به سراغ منابع کلانداده ای دیگری مثل دادههای رهیابی اینترنتی یا دادههای ارتباطات مصرفکنندگان در شبکههای اجتماعی مثل توییتر، فیسبوک یا یوتیوب هم رفت.
Information and Communication Technologies in Tourism 2017
Proceedings of the International Conference: in Rome, Italy, January 24–26, 2017