การถอดรหัส URL และการเข้ารหัส URL คืออะไร?
เผยแพร่แล้ว: 2022-07-21เมื่อคุณเปิดเว็บไซต์ คุณอาจเจอการถอดรหัส URL และการเข้ารหัส URL หากคุณยังไม่เจอสิ่งเหล่านี้ หรือคุณเพิ่งเจอพวกเขาเป็นครั้งแรกและต้องการข้อมูลเพิ่มเติม เราจะอธิบายเกี่ยวกับสิ่งเหล่านี้ที่นี่
URL คืออะไร?
URL (Uniform Resource Locator) คือที่อยู่ที่ใช้โดยเบราว์เซอร์เพื่อค้นหาทรัพยากรบนอินเทอร์เน็ต โดยปกติ URL จะนำไปสู่หน้าเว็บ เช่นเดียวกับที่คุณกำลังอ่าน อย่างไรก็ตาม บางครั้งอาจนำไปสู่เอกสาร (เช่น เอกสาร pdf)
URL ทั้งหมดมีโครงสร้างที่คิดค้นโดย Tim Berners-Lee ผู้ประดิษฐ์เวิลด์ไวด์เว็บ พวกเขายังสอดคล้องกับไวยากรณ์ทั่วไปที่มีลักษณะดังนี้:
scheme:{//{user:password@}host{:port}}path{?query}{#fragment}
ลักษณะบางอย่างของไวยากรณ์ URL เลิกใช้แล้วและไม่ได้ใช้บ่อยเพราะจะมีปัญหาด้านความปลอดภัย ตัวอย่างที่ดีคือด้าน {user:password}
การส่งโดยไม่มีการป้องกันรูปแบบใดๆ จะทำให้แฮกเกอร์สามารถเข้าถึงระบบที่ไม่ควรจะทำได้
URL ทั่วไปที่คุณอาจเห็นประกอบด้วย:
https://example.com/page-1
สำหรับ URL นี้ สคีมคือ https โฮสต์คือ example.com และเส้นทางคือองค์ประกอบ page-1
อักขระ URL ที่อนุญาต
URL สามารถมีได้เฉพาะอักขระบางตัวเท่านั้น อักขระทั้งหมดเป็นของชุดอักขระ US-ASCII ซึ่งประกอบด้วยตัวเลข (0-9) ตัวอักษร (az) และอักขระพิเศษสองสามตัว หากมีอักขระที่อยู่ใน URL โดยเจ้าของเว็บไซต์ที่ไม่ได้รวมอยู่ในการเข้ารหัส US-ASCII หรือสงวนไว้สำหรับความหมายพิเศษ (รวมถึง ?, /, #, :) URL จะต้องมีการเปลี่ยนแปลง .
นี่คือจุดเริ่มต้นของการเข้ารหัส เนื่องจากส่วนใดของ URL ไม่ควรมีอักขระ 'สงวน' เหล่านี้ เว้นแต่จะมีเหตุผลเฉพาะที่ควรใช้ ตัวอย่างเช่น อักขระ / ใช้เพื่อระบุเส้นทางใน URL
ดังนั้น เมื่อมีการใช้อักขระตัวใดตัวหนึ่ง ข้อมูลที่รวมอยู่ใน URL จะต้องได้รับการเข้ารหัส นี่คือขั้นตอนเมื่อกระบวนการเข้ารหัส URL แปลงอักขระสงวน อักขระที่ไม่ปลอดภัย และอักขระที่ไม่ใช่ ASCII ให้อยู่ในรูปแบบที่เว็บเบราว์เซอร์และเซิร์ฟเวอร์เข้าใจในระดับสากลมากขึ้น
อักขระถูกเปลี่ยนในระหว่างขั้นตอนการเข้ารหัสเป็นสิ่งที่มีขนาดตั้งแต่หนึ่งไบต์ขึ้นไปซึ่งแสดงด้วยเลขฐานสิบหกสองหลักที่นำหน้าด้วยเครื่องหมายเปอร์เซ็นต์ (%) นี่คือเหตุผลที่บางครั้งการเข้ารหัส URL เรียกว่าการเข้ารหัสแบบเปอร์เซ็นต์
ตัวอย่างนี้คือถ้าคุณจะส่ง URL
https://example.com/hello world
สังเกตช่องว่างระหว่างสวัสดีและโลก ไม่อนุญาตในรูปแบบ URL มาตรฐาน ดังนั้นจึงจำเป็นต้องเปลี่ยน มาตรฐานสำหรับสิ่งนี้จะเป็น %20 โดยที่ 20 เป็นตัวแทนมาตรฐานสำหรับช่องว่าง ดังนั้น URL ที่ส่งหลังจากการเข้ารหัส URL จะมีลักษณะดังนี้:
https://example.com/hello%20world
ทำไมการเข้ารหัส URL จึงสำคัญ?
การเข้ารหัส URL เป็นส่วนสำคัญในการทราบเมื่อมีข้อผิดพลาดภายใน URL ของคุณ หากคุณสามารถระบุได้ว่าเมื่อใดที่การเข้ารหัสเกิดขึ้น คุณสามารถเข้าไปที่โครงสร้างของคุณและค้นหาวิธีแก้ไขปัญหาโดยสร้าง URL ใหม่
หรือคุณอาจพบว่าคุณมีอักขระที่ไม่ได้มาตรฐานซึ่งคุณต้องมีในโครงสร้างของ URL และจำเป็นต้องค้นหาวิธีเข้ารหัสเพื่อให้ยอมรับ อาจเป็นกรณีนี้เมื่อคุณมีคำถามในหน้าและต้องการลิงก์ไปยังส่วนนั้นของหน้า คุณไม่สามารถมี '?' ในโครงสร้าง URL เนื่องจากเป็นอักขระที่สงวนไว้ ดังนั้น คุณจะต้องเข้ารหัส

URL เดิมที่คุณอาจต้องการคือ:
https://example.com/questions#what-is-the-question?
แต่ในการเข้ารหัสจะเปลี่ยนเป็น:
https://example.com/questions#what-is-the-question%3F
จากนั้นจะนำผู้เข้าชมไปยังคำถามของหน้า บนโดเมน example.com และไปยังส่วนของหน้า 'คำถามคืออะไร'
วิธีการโค้ด URL อย่างถูกต้อง
มีปัญหาว่าเมื่อคุณต้องการเข้ารหัส URL คุณสามารถทำผิดพลาดได้ในด้านการเข้ารหัส ตัวอย่างเช่น สมมติว่า URL example.com/a+b/c จำเป็นต้องเข้ารหัส / ระหว่าง b และ c อาจเป็นสัญลักษณ์สำหรับเส้นทาง ดังนั้นอักขระที่อนุญาตภายใน URL หรืออาจเป็นสัญลักษณ์สำหรับการแบ่ง
ดังนั้น การเข้ารหัส URL example.coma+b/c อาจส่งผลให้
example.com/a%2Bb/c or example.com/a%2Bb%2Fc.
ดังนั้น ในการเข้ารหัสโดเมนอย่างถูกต้อง คุณจำเป็นต้องรู้ว่า / ระหว่าง b และ c หมายถึงอะไร หมายถึงทางแยกหรือเส้นทางในที่อยู่หรือไม่?
จากนั้น ในการเข้ารหัส URL อย่างถูกต้อง คุณต้องเข้ารหัสส่วนต่างๆ ซึ่งรวมถึงโฮสต์ (เช่น example.com) และทุกเส้นทาง
ดังนั้น หากเป็นเส้นทางอื่น คุณจะต้องเข้ารหัสสามส่วน: example.com, a+b และ c
อย่างไรก็ตาม หากมีวัตถุประสงค์เพื่อแสดงถึงการแบ่ง คุณควรเข้ารหัสสองส่วน example.com และ a+b/c
เพื่อช่วยในการเข้ารหัส URL ของคุณ คุณสามารถใช้เครื่องมือถอดรหัส URL และเครื่องมือเข้ารหัส URL ออนไลน์ฟรีจาก Gochyu คุณจะต้องป้อนเส้นทางต่างๆ ของ URL แยกกัน แต่จะให้รหัสที่ถูกต้องสำหรับความสำเร็จ
คุณยังสามารถแยกแต่ละส่วนของ URL ออกเป็นบรรทัดใหม่เพื่อให้ได้ URL ที่สมบูรณ์ในครั้งเดียว
ดังนั้น URL
example.com/questions/what-is-the-question?#Answer#1
ควรออกมาเป็น:
example.com/questions/what-is-the-question%3F/#Answer%231
การถอดรหัส URL คืออะไร?
การถอดรหัส URL เป็นกระบวนการของการเข้ารหัส URL แบบย้อนกลับ เมื่อ URL ได้รับการเข้ารหัสเนื่องจากมีอักขระที่ไม่เป็นที่ยอมรับ ตอนนี้คุณสามารถถอดรหัส URL นั้นเพื่อให้อยู่ในรูปแบบที่อ่านง่ายขึ้น
นี่เป็นสิ่งสำคัญสำหรับการค้นหาข้อผิดพลาดภายใน URL ตัวอย่างเช่น คุณอาจใส่ # ใน URL โดยไม่ได้ตั้งใจ ด้วยการถอดรหัส คุณสามารถลบสิ่งเหล่านี้และทำให้ URL อ่านง่ายขึ้นสำหรับทั้งเครื่องมือค้นหาและมนุษย์ เมื่อนำออกแล้ว คุณจะเห็นอันดับเว็บไซต์ของคุณดีขึ้นในเครื่องมือค้นหาหรือได้รับการเข้าชมโดยตรงมากขึ้น เนื่องจากขณะนี้ผู้คนสามารถใช้ URL มาตรฐานได้แล้ว
หากคุณต้องการถอดรหัส URL คุณสามารถใช้เครื่องมือถอดรหัส URL และเข้ารหัส URL ออนไลน์ได้ฟรี สิ่งที่คุณต้องทำคือป้อน URL ที่เข้ารหัสลงในช่องแล้วกดปุ่มถอดรหัส
คำสุดท้าย: การถอดรหัส URL และการเข้ารหัส URL คืออะไร
การเข้ารหัสคือการเปลี่ยนอักขระอย่างง่ายภายใน URL ที่ไม่สามารถใช้ได้ด้วยเหตุผลหลายประการ ให้เป็นโค้ดมาตรฐาน เพื่อป้องกันข้อผิดพลาดในการดึงทรัพยากรจากเซิร์ฟเวอร์และอนุญาตให้ไซต์แสดงผลบนเว็บเบราว์เซอร์ได้อย่างถูกต้อง การถอดรหัสเป็นสิ่งที่ตรงกันข้าม
เป็นสิ่งสำคัญมากที่จะต้องรู้ว่าเมื่อใดที่ URL ได้รับการเข้ารหัส และตรวจสอบให้แน่ใจว่าคุณสามารถใช้การเข้ารหัส URL และการถอดรหัส URL เพื่อแก้ไขข้อผิดพลาดบนเว็บไซต์ของคุณได้