مشاوره Semalt در مورد چگونگی استفاده از یادگیری عمیق برای بهینه سازی برچسب عنوان خودکار خود



یک راه سریع برای پیشگام شدن در رتبه بندی SEO خود ، قرار دادن یک کلمه کلیدی با رتبه برتر در برچسب عنوان آنها است. و اگر یک دقیقه به آن فکر کنید ، متوجه خواهید شد که واقعاً یک راه حل هوشمندانه است. اگر صفحه ای دارید که قبلاً برای یک کلمه کلیدی رتبه بندی شده است بدون اینکه آن کلمه کلیدی در عنوان وجود داشته باشد ، اهمیت وجود کلمه کلیدی در عنوان را تصور کنید. شما به طور طبیعی بیشتر اوقات برای آن کلمه کلیدی نمایه خواهید شد. از این رو شما رتبه بهتری دارید.

حال ، اگر آن کلمه کلیدی را بگیریم و آن را به Meta Description اضافه کنیم ، در نتایج جستجو برجسته به نظر می رسند به این معنی که احتمالاً کاربران موتور جستجوی بیشتری کلیک می کنند. این البته به نفع وب سایت خواهد بود.

تصور کنید Semalt در حال کار بر روی وب سایتی با صدها ، هزاران یا میلیون ها صفحه بود. اگر مجبور بودیم این کار را به صورت دستی انجام دهیم ، زمان بر خواهد بود و به سرعت گران خواهد شد. بنابراین چگونه می توانیم صفحه آن را تجزیه و تحلیل کنیم و هر عنوان و توصیف متا را بهینه کنیم؟ راه حل استفاده از دستگاه است. با آموزش دستگاهی برای یافتن بالاترین رتبه کلمات کلیدی در هر صفحه ، در وقت و هزینه صرفه جویی می کنیم. در نهایت استفاده از یک ماشین می تواند عملکرد بهتر و سریع تری نسبت به تیم ورود اطلاعات داشته باشد.

بیایید Ludwig اوبر و T5 گوگل را دوباره معرفی کنیم

با ترکیب لودویگ اوبر و T5 گوگل ، شما یک سیستم کاملاً قدرتمند دارید.

به طور خلاصه ، Ludwig یک ابزار ML خودکار منبع باز است که به کاربرانش امکان می دهد بدون نیاز به نوشتن کد ، مدل های پیشرفته را آموزش دهند.

از طرف دیگر ، Google T5 نسخه برتر مدل های مدل SERT است. T5 می تواند خلاصه ، ترجمه ، پاسخ به س questionsالات و طبقه بندی نمایش داده شده جستجو و همچنین بسیاری از توابع دیگر. به طور خلاصه ، این یک مدل بسیار قدرتمند است.

با این حال ، هیچ نشانه ای وجود ندارد که T5 برای بهینه سازی برچسب عنوان آموزش دیده باشد. اما شاید ما بتوانیم این کار را انجام دهیم ، و نحوه کار این است:
  • ما یک مجموعه داده آموزش دیده با نمونه های ساخته شده از:
    • برچسب های عنوان اصلی بدون کلمه کلیدی هدف ما
    • کلید واژه (های) هدف ما
    • برچسب های عنوان بهینه شده با کلمات کلیدی مورد نظر
  • یک کد تنظیم T5 و آموزش برای استفاده
  • مجموعه ای از عناوین را داشته باشید که بهینه نشده اند تا بتوانیم مدل خود را آزمایش کنیم
ما با یک مجموعه داده که قبلاً ایجاد شده شروع به کار می کنیم و راهنمای نحوه ایجاد مجموعه داده را ارائه خواهیم داد.

نویسندگان T5 آنقدر سخاوتمند بودند که یک دفترچه یادداشت دقیق Google Colab ، که از آن برای تنظیم دقیق T5 استفاده می کنیم ، در اختیار ما قرار دهند. پس از صرف وقت برای مطالعه آن ، ما توانستیم به س triالات چیزهای بی اهمیت دلخواه پاسخ دهیم. نوت بوک Colab همچنین دارای دستورالعمل هایی در مورد نحوه تنظیم دقیق T5 برای کارهای جدید است. با این حال ، وقتی به تغییرات کد و آماده سازی داده های مورد نیاز نگاه می کنید ، متوجه می شوید که این کار شامل کار زیادی می شود و ممکن است ایده های ما عالی باشد.

اما اگر می تواند ساده تر باشد چه؟ با تشکر از Uber Ludwig نسخه 3 ، که چند ماه پیش منتشر شد ، ما ترکیبی از برخی از ویژگی های بسیار مفید را داریم. نسخه 3.0 Ludwig همراه با:
  • مکانیزم بهینه سازی ابرپارامتر که عملکرد اضافی را از مدل ها بدست می آورد.
  • ادغام بدون کد با مخزن Hugging Face's Transformers. این به کاربران اجازه می دهد تا برای کارهای پردازش زبان طبیعی به مدل های به روز شده مانند GPT-2 ، T5 ، DistilBERT و Electra دسترسی پیدا کنند. برخی از این کارها شامل تجزیه و تحلیل احساسات طبقه بندی ، شناسایی نهاد ، پاسخ دادن به س questionال و موارد دیگر است.
  • این جدیدتر ، سریعتر ، مدولار است و دارای یک باطن قابل توسعه است که به TensorFlow 2 متکی است.
  • این پشتیبانی از بسیاری از قالب های داده جدید مانند Apache Parquet ، TSV و JSON را فراهم می کند.
  • این از اعتبار سنجی متقابل k برابر برابر نیست.
  • وقتی با Weights and Biases تلفیق شود ، می توان از آن برای مدیریت و نظارت بر فرآیندهای آموزش مدل های متعدد استفاده کرد.
  • این یک نوع داده بردار جدید دارد که از برچسب های پر سر و صدا پشتیبانی می کند. اگر با نظارت ضعیفی روبرو شویم ، این کار مفید خواهد بود.
چندین ویژگی جدید وجود دارد ، اما ما ادغام Hugging Face's Transformers را به عنوان یکی از مفیدترین ویژگی ها می دانیم. از خطوط لوله آغوش می توان برای بهبود قابل توجه تلاش SEO در عناوین و تولید توضیحات متا استفاده کرد.

استفاده از خط لوله برای اجرای پیش بینی در مورد مدلهایی که قبلاً آموزش دیده اند و از قبل در حباب مدل موجود هستند ، بسیار مناسب است. با این حال ، در حال حاضر هیچ مدلی وجود ندارد که بتواند آنچه را که ما نیاز داریم انجام دهد ، بنابراین ما با ترکیب Ludwig و Pipeline یک عنوان اتوماتیک و Meta Description عالی برای هر صفحه در یک وب سایت ایجاد می کنیم.

چگونه از Ludwig به Fine-Tune T5 استفاده کنیم؟

این س importantال مهمی است زیرا ما سعی می کنیم مشتریان خود را دقیقاً در پس زمینه وب سایت آنها نشان دهیم. در اینجا ، یک کلیشه وجود دارد که می گوید: "استفاده از لودویگ برای آموزش T5 بسیار ساده است ، ما باید آن را غیرقانونی بدانیم." واقعیت این است که اگر مجبور به استخدام یک مهندس هوش مصنوعی برای انجام معادل آن شویم ، هزینه های بسیار بالاتری را از مشتریان خود جریمه می کردیم.

در اینجا ، شما خواهید فهمید که ما چگونه T5 را دقیق تنظیم می کنیم.
  • مرحله 1: دفترچه یادداشت جدید Google Colab را باز کنید. پس از آن ، ما Runtime را تغییر می دهیم تا از GPU استفاده کنیم.
  • ما مجموعه داده های Hootsuite را که قبلاً جمع آوری شده است بارگیری می کنیم.
  • سپس لودویگ را نصب می کنیم.
  • پس از نصب ، مجموعه داده های آموزشی را در یک فریم داده pandas بارگذاری می کنیم و آن را بازرسی می کنیم تا ببینیم چه شکلی است.
  • سپس با مهمترین مانع ، ایجاد فایل پیکربندی مناسب روبرو می شویم.
ساخت یک سیستم بی نقص مستلزم مستند سازی T5 و آزمایش و خطای مداوم است تا زمانی که آن را درست انجام دهیم. (اگر بتوانید کد پایتون را برای تولید در اینجا پیدا کنید بسیار طولانی خواهد شد.)

اطمینان حاصل کنید که دیکشنری های ویژگی های ورودی و خروجی را مرور کرده و از انتخاب صحیح تنظیمات خود اطمینان حاصل کنید. اگر درست انجام شود ، لودویگ شروع به استفاده از 't5-small' به عنوان مدل در حال اجرا می کند. برای مدلهای بزرگتر T5 ، تغییر در توپی مدل و بهبود بالقوه تولید آن آسانتر است.

پس از چندین ساعت آموزش یک مدل ، ما از صحت اعتبار سنجی قابل توجهی برخوردار می شویم.

مهم است که توجه داشته باشید Ludwig به طور خودکار سایر اندازه گیری های مهم تولید متن ، عمدتاً گیجی و فاصله ویرایش را انتخاب می کند. این هر دو عدد کم است که به درستی برای ما مناسب است.

چگونه ما از مدل های آموزش دیده خود برای بهینه سازی عناوین استفاده می کنیم

آزمایش مدل های ما قسمت جالب واقعی است.

ابتدا یک مجموعه داده آزمایشی را با عناوین غیربهینه Hootsuite بارگیری می کنیم که در حین آموزش توسط مدل دیده نشده اند. با استفاده از این دستور می توانید مجموعه داده را پیش نمایش کنید:

!سر

زیرنویس های Hootsuite_to_optimize.csv

اینکه Ludwig و T5 می توانند با هر مجموعه آموزشی کوچکی کارهای زیادی انجام دهند بسیار چشمگیر است و نیازی به تنظیم پیشرفته Hyperparameter نیست. آزمون مناسب به نحوه تعامل آن با کلمات کلیدی هدف ما برمی گردد. چقدر خوب مخلوط می شود؟

ساخت برنامه بهینه سازی برچسب عنوان با Streamlight

نویسندگان محتوا این نرم افزار را بسیار مفید می دانند. آیا داشتن یک برنامه کاربردی ساده که به دانش فنی زیادی احتیاج ندارد ، شگفت آور نخواهد بود؟ خوب ، این فقط همان چیزی است که Streamlight در اینجا قرار دارد.

نصب آن و همچنین استفاده از آن کاملاً رو به جلو است. می توانید آن را با استفاده از نصب کنید:

! pip ساده سازی را نصب کنید

ما برنامه ای ایجاد کرده ایم که از این مدل استفاده می کند. در صورت نیاز ، می توانیم آن را از همان مکانی که یک مدل را آموزش می دهیم ، اجرا کنیم یا می توانیم یک مدل آموزش دیده را از جایی که قصد اجرای اسکریپت را داریم ، بارگیری کنیم. ما همچنین یک فایل CSV با عنوان و کلمات کلیدی آماده کرده ایم که امیدواریم بتوانیم آنها را بهینه کنیم.

حالا ما برنامه را راه اندازی می کنیم. برای اجرای مدل ، باید مسیر فایل CSV را ارائه دهیم که دارای عناوین و کلمات کلیدی است که امیدواریم بتوانیم آنها را بهینه کنیم. نام ستون CSV هنگام آموزش لودویگ باید با نام ها مطابقت داشته باشد. اگر مدل همه عناوین را بهینه نمی کند ، نباید وحشت کنید. گرفتن یک عدد مناسب و معقول نیز گامی بزرگ به جلو است.

ما به عنوان کارشناسان پایتون هنگام کار با این موضوع بسیار هیجان زده می شویم ، زیرا این کار معمولاً باعث پمپاژ خون ما می شود.

نحوه تولید یک مجموعه داده سفارشی برای آموزش

با استفاده از عناوین Hootsuite ، ما می توانیم مدل هایی را آموزش دهیم که برای مشتریان خوب باشد اما ممکن است برای رقبای آنها پیش فرض باشد. به همین دلیل اطمینان حاصل می کنیم که مجموعه داده های خود را تولید می کنیم و نحوه انجام این کار در اینجا است.
  • ما داده های خود را از Google Search Console یا Bing Webmaster Tools استفاده می کنیم.
  • به عنوان یک گزینه دیگر ، ما همچنین می توانیم داده های رقابت مشتری خود را از SEMrush ، Moz ، Ahrefs و غیره بگیریم.
  • سپس یک اسکریپت برای برچسب های عنوان می نویسیم و سپس عناوینی را که کلمه کلیدی مورد نظر را دارند و ندارند ، تقسیم می کنیم.
  • ما عناوینی را که با استفاده از کلمات کلیدی بهینه شده اند می گیریم و کلمات کلیدی را با کلمات مترادف جایگزین می کنیم ، یا از روش های دیگر استفاده می کنیم تا عنوان "بهینه سازی نشود".

نتیجه

Semalt اینجا است تا به شما در بهینه سازی برچسب های عنوان و همچنین توضیحات متا به صورت خودکار کمک کند. با این کار می توانید جلوتر از SERP باشید. تجزیه و تحلیل وب سایت هرگز کار ساده ای نیست. به همین دلیل آموزش یک ماشین برای کمک به ما در انجام این کار علاوه بر صرفه جویی در هزینه ، باعث صرفه جویی در وقت نیز می شود.

در Semalt ، متخصصانی هستند که مجموعه داده ، Ludwig و T5 شما را تنظیم می کنند تا بتوانید همیشه برنده باشید.

امروز با ما تماس بگیر.

mass gmail