پیش‌بینی میزان گردشگران ورودی با استفاده از کلان‌داده‌ها

صنعت حمل و نقل آنلاین: به گزارش سازمان جهانی گردشگری در 60 سال گذشته میزان گردشگر ورودی خارجی بیش از 4 هزار درصد افزایش یافته و در سال 2015 میلادی به 1.2 میلیارد نفر رسیده است، به طوری که مقصدهای گردشگری و فراهم‌آوران خدمات به پیش‌بینی دقیق تقاضای گردشگری نیاز شدیدی دارند زیرا این روند افزایشی همچنان ادامه دارد و با پدیده‌ای ایستا سر و کار نداریم.

گردشگری یکی از مهم‌ترین بخش‌های کسب و کار است و 7 درصد کل صادرات جهان را در اختیار دارد و همچنان بازار رو به رشدی است. منظور از گردشگری ورودی آن نوع از گردشگری است که فردی بیگانه به کشور مورد نظر سفر کند و نیز در تقابل با گردشگری خروجی قرار دارد مانند فردی که از کشور خودمان به کشوری خارجی سفر کند.

گردشگری ورودی با آن که از روندهایی درازمدت پیروی می‌کند، دارای روندهای فصلی نیرومندی هم هست. یعنی در فصول مختلف سال روند خاص خودش را دارد.  از این رو پیش‌بینی تقاضای آتی گردشگری بر اساس میزان گردشگری ورودی در گذشته به طور معمول نتایج رضایت‌بخش و کاربرد گسترده‌ای در گردشگری داشته است. اما تقاضای گردشگری و به خصوص گردشگری ورودی بین‌المللی به شدت متأثر از عوامل خارجی مثل عوامل اقتصادی از قبیل نرخ ارز و درآمد مصرف‌کنندگان یا عوامل خاص مقصد از قبیل فعالیت‌های بازاریابی در مقصد هم هست. افزون بر این کاربری فزاینده‌ اینترنت در میان گردشگران برای گردآوری اطلاعات و شناسایی ردپای الکترونیکی چنین کاربرانی می‌تواند منابع اطلاعاتی جدید و نویدبخشی باشد و دقت پیش‌بینی تقاضا را افزایش دهد تا بتوان با نوسانات غیرعادی تقاضا بر اثر رویدادهای بزرگ مواجه شد. بنابراین این گونه منابع اطلاعات خارجی و مبتنی بر اینترنت که در اغلب موارد کلان‌داده نامیده می‌شوند، ورودی‌های دیگر برای بهکرد پیش‌بینی تقاضای گردشگری هستند.

منظور از کلان داده نیز داده‌هایی است که چنان بزرگ و پیچیده هستند که برنامه‌های کاربردی سنتی برای پردازش آن‌ها کفایت نمی‌کند. تحلیل، برداشت، جستجو، اشتراک‌گذاری، ذخیره‌سازی، انتقال، نمایش، روزآوری و حفظ حریم این اطلاعات بسیار پرچالش است.

 

مشخصات داده‌گان

  • میزان گردشگر ورودی: شمار گردشگران ورودی خارجی به مقصد مورد نظر در هر ماه و کشوری که از آن می‌آیند.
  • درآمد: میزان تولید ناخالص داخلی(جی‌دی‌پی) کشورهایی که گردشگران مورد نظر از آن جا می‌آیند به عنوان شاخص درآمد هر گردشگر که اثر چشم‌گیری بر تقاضای گردشگری دارد.
  • تراز قیمت در مقصد: گردشگران به طور معمول میزان هزینه‌ها در مقصد (بر اساس ارز کشور مقصد) را مبنای تصمیم‌گیری‌های مسافرتی خود قرار می‌دهند. تراز قیمت برای گردشگران خارجی را با نسبت شاخص قیمت مصرف‌کننده (سی‌پی‌آی) در کشور مقصد محاسبه می‌کنند. در واقع سی‌پی‌آی قیمت متوسط مجموعه‌ای از کالاها و خدمات مصرفی مثل مواد غذایی و خدمات پزشکی را مشخص می‌کند.
  • تراز قیمت در مقصدهای دیگر: تراز قیمت در مقصدهای رقیب بر کشش قیمت تقاضای گردشگری اثر می‌گذارد و به روشی مشابه روش محاسبه‌ تراز قیمت در مقصد آن را محاسبه می‌کنند.
  • هزینه‌های حمل و نقل: هزینه‌های حمل و نقل سهم چشم‌گیری از کل بودجه‌ مسافرت است و بر تصمیم‌گیری‌های مسافرتی اثر می‌گذارد. در گردشگری بین‌المللی حمل‌ونقل هوایی اهمیت زیادی دارد که خود متأثر از قیمت جهانی سوخت هواپیما و در نتیجه قیمت جهانی نفت است.
  • هزینه‌های تبلیغات: مخارج تبلیغات بر تقاضای گردشگری اثر دارد و داده‌های سالانه‌ آن را در محاسبات دخالت می‌دهند.
  • اثر فصل‌های مختلف و رویدادهای مهم: رویدادهای مهم فصول مختلف از قبیل مسابقات ورزشی هم بر تقاضای گردشگری اثر مهمی می‌گذارند. برای مثال مسابقات جام باشگاه‌های اروپا می‌تواند میزان گردشگری ورودی در شهرهای میزبان را به طور چشم‌گیری افزایش دهد.

 

برای مثال در شکل زیر میزان ورود گردشگران دانمارکی به نواحی کوهستانی سوئد و میزان جستجوهای اینترنتی آن‌ها به نمایش در آمده است که به وضوح نشان می‌دهد بین شمار جستجوی اطلاعات مناطق کوهستانی سوئد در گوگل و میزان ورود گردشگران دانمارکی همبستگی نیرومندی وجود دارد. یعنی میزان جستجو در گوگل می‌تواند منبع کلان‌داده‌ای بسیار خوبی برای افزایش دادن دقت پیش‌بینی تقاضا باشد.

در شکل زیر هم اثر قیمت سوخت هواپیما بر میزان ورود گردشگران دانمارکی به مناطق کوهستانی سوئد به تصویر کشیده شده است. همان طور که مشخص است افزایش قیمت سوخت هواپیما در دوره‌ 2007 تا 2008 کاهش ورود گردشگری در فاصله‌ 2008 تا 2009 را به دنبال داشته و کاهش شدید قیمت سوخت هواپیما در سال 2009 افزایش چشم‌گیر ورود گردشگر در سال 2010 را در پی داشته است.

در هر دو مورد بین عامل اثرگذار و میزان گردشگری ورودی مقداری پس‌افت زمانی وجود دارد که دخیل کردن آن در محاسبه اهمیت زیادی دارد.

در روش سنتی خود-وایاز(Autoregressive) برای پیش‌بینی از داده‌های ورودی گذشته برای پیش‌بینی ورودی‌های آینده استفاده می‌کنند و پس‌افت‌های زمانی مختلف را هم در نظر می‌گیرند. پس‌افت زمانی در سایر عوامل پیش‌گفته مثل مخارج تبلیغاتی هم دخالت دارد.

اما در اکثر روش‌های داده‌کاوی ( شبکه‌های عصبی مصنوعی، درخت‌واره‌های تصمیم‌گیری و نزدیک‌ترین همسایه) بر خلاف روش وایازی خطی نیازی نیست که ویژگی‌های آماری خاصی مثل غیر هم‌خطی بودن خصیصه‌های ورودی برای داده‌گان درست باشد. یعنی می‌توان در تدوین الگوی پیش‌بینی، برای تمام پس‌افت‌های زمانی در گستره‌ زمانی مورد نظر، خصیصه‌های ورودی را در داده‌گان گنجاند. اندازه‌ گستره‌ زمانی را باید به دقت برگزید تا تمام روندها و الگوهای مهم را در برگیرد. مثلاً گستره‌ زمانی 24 ماه می‌تواند با ویژگی موسمی بودن و روندهای چندساله به خوبی سازگار باشد.

روش سنتی وایازی خطی: رهیافت آماری وایازی خطی برای پیش‌بینی میزان گردشگران ورودی بسیار مناسب است. در این روش برای آن که از در نظرگیری خصیصه‌های ورودی غیر مهم یا دارای همبستگی شدید در الگوی وایازی جلوگیری شود (بر اثر درنظرگیری خصیصه‌های دارای پس‌افت زمانی مختلف) از گزینش پیش‌سو برای الگوسازی داده‌ای استفاده می‌کنند و مادامی که افزایش کارایی از پیش تعریف‌شده‌ای قابل حصول باشد افزایش مهم‌ترین خصیصه‌ها تداوم دارد.

روش kنزدیک‌ترین همسایه(k-NN): در الگوریتم k-NNخصیصه‌ هدف هر مدخل داده‌ای جدید را بر اساس تعداد شبیه‌ترین مدخل داده‌ای در مجموعه‌ داده‌گان برآورد می‌کنند که با k نشان داده می‌شود. در مورد پیش‌بینی میزان گردشگر ورودی بر اساس گستره‌های زمانی، این الگوریتم شمار گردشگران ورودی در زمان  t را بر اساس نقاط زمانی گذشته که دارای شبیه‌ترین مقادیر خصیصه‌‌ ورودی در گستره‌ زمانی مربوطه هستند برآورد می‌کند.

کارایی دو روش فوق را می‌توان با اعتبارسنجی از طریق گستره‌های زمانی متغیر مورد سنجش قرار داد. که در مورد پیش‌بینی میزان گردشگران ورودی دانمارک به نواحی کوهستانی سوئد در جدول زیر آمده است.

روش پیش‌بینی کشور مبداء گردشگران روش خود-وایاز روش کلان‌داده
RMSE MAE RMSE MAE
 خود-وایاز خطی دانمارک 1320.27 753.20 553.37 413.96
k-NN دانمارک 812.10 509.15 653.32 360.06

MAE:میانگین خطای مطلق

RMSE:خطای جذر میانگین مربعات

با مقایسه‌ دو روش تخمین مشخص است که در هر دو روش افزودن منابع اطلاعات داده‌ای کلان به عنوان ورودی اضافی می‌تواند کارایی پیش‌بینی را به گونه‌ چشم‌گیری افزایش دهد و این افزایش در روش سنتی خیلی بیش‌تر است. متوسط MAE برای روش پیش‌بینی k-NN به میزان 30 درصد کاهش داشته است. بنابراین می‌توان گفت منابع اطلاعات کلان‌داده‌ای می‌توانند دقت پیش‌بینی گردشگری ورودی را در مقایسه با روش سنتی به میزان چشم‌گیری افزایش می‌دهد.

افزون بر این، استفاده از منابع اطلاعات کلان‌داده‌ای سبب می‌شود در هنگام بروز رویدادهای بزرگ هم بتوان میزان گردشگری ورودی را تخمین زد. وقتی تغییری خارق‌العاده رخ دهد مثلاً نرخ ارز یا هزینه‌ حمل و نقل به شدت تغییر کند یا رویداد ورزشی بزرگی یا بحرانی طبیعی رخ دهد روش مبتنی بر کلان‌داده‌ها خیلی کارآمدتر از روش سنتی است. بنابراین در موقعیت‌های غیرعادی، پیش‌بینی مبتنی بر کلان‌داده‌ها می‌تواند پشتوانه ای باارزش برای تصمیم‌گیری در حوزه‌ گردشگری باشد. در واقع روش جدید به طور کامل گوی سبقت را از روش سنتی می‌رباید.

تحقیقات کنونی محدود به شمار محدودی از منابع اطلاعات کلان‌داده‌ای است که داده‌های روندنمای گوگل معروف‌ترین‌شان است اما در مطالعات آینده باید به سراغ منابع کلان‌داده ای دیگری مثل داده‌های رهیابی اینترنتی یا داده‌های ارتباطات مصرف‌کنندگان در شبکه‌های اجتماعی مثل توییتر، فیسبوک یا یوتیوب هم رفت.

 

 

Information and Communication Technologies in Tourism 2017

Proceedings of the International Conference: in Rome, Italy, January 24–26, 2017

 

تازه‌های کسب و کار