15 พ.ค. 2021 เวลา 08:14 • การศึกษา
วิธีติดตั้งแพ็กเกจ เลือกที่จะติดตั้ง pyspark ซึ่งใช้ในงานด้าน Big Data ที่นับวันจะมีความต้องการบุคลากรด้านนี้มากขึ้น
โดยจะติดตั้งใน environment ที่เพิ่งสร้างใหม่ในครั้งที่แล้ว วิธีการยังคงจะใช้ Anaconda Navigator เช่นเดิม เนื่องด้วยเป็น GUI (Graphical User Interface) น่าจะง่ายสำหรับผู้เริ่มต้น
สิ่งที่ยากที่สุดในการติดตั้ง pyspark คือ การหาแหล่งที่เก็บ pyspark และแพ็กเกจอื่นๆที่ใช้ร่วมกัน และต้องทราบเวอร์ชันที่เข้ากันได้ (pyspark ไม่ใช่ spark แต่ทำให้ใช้ spark ได้) เท่าที่ได้ทดลองพบว่า ถ้าติดตั้ง pyspark 2.4.5 และ openjdk 8.0.152 ที่ได้มาจาก Anaconda Channel และถ้าได้ติดตั้งไว้ใน environment เดียวกัน ก็จะใช้งานได้ทันที และยังไม่พบปัญหาตามมา อย่างน้อยก็จนถึงเวลานี้ (เป็นการใช้ Spyder เขียนโค้ดและดีบัก)
การติดตั้ง pyspark ด้วย Anaconda Navigator มี 11 ขั้นตอน (โดยละเอียด)
(1) พิมพ์ Anaconda Navigator แล้วคลิก Open
(2) คลิก Environments
(3) คลิกชื่อของ Environment ที่จะติดตั้งแพ็กเกจ
(4) มองหาปุ่ม Channels ทางขวามือ
(5) คลิก Channels จะเห็นรายชื่อ channel
(6) กดรูปถังขยะเพื่อลบ channels จนหมด
(7) คลิก Add และพิมพ์ชื่อเพียง channel เดียว
(8) คลิก Update channels
(9) พิมพ์แพ็กเกจในช่องค้น ขณะเลือก All
(10) ติ๊กเลือกแพ็กเกจเดียว และคลิก Apply
(11) ตรวจสอบเวอร์ชันและคลิก Apply
(1)
ขั้นตอนที่ 1 - เปิดใช้ Anaconda Navigator
(2,3)
ขั้นตอน 2,3 - คลิก Environments และคลิกชื่อ environment เพื่อที่จะติดตั้งแพ็กเกจลงในนั้น (กรณีนี้ชื่อ abc)
(4)
ขั้นตอนที่ 4 - มองหาปุ่ม Channels ทางขวามือ
(5)
ขั้นตอนที่ 5 - คลิกปุ่ม Channels จะเห็น channels ที่กำลังใช้อยู่ (กรณีนี้มี defaults อยู่เพียง channel เดียว)
(6)
ขั้นตอนที่ 6 - ลบ channels ออกให้หมด และจะเติม channel ที่ต้องการเพียง channel เดียวในขั้นตอนต่อไป
(7)
ขั้นตอนที่ 7 - คลิก Add, พิมพ์ชื่อ channel ที่ต้องการเพียงชื่อเดียว (กรณีนี้ชื่อ anaconda)  และ Enter  เพื่อที่ว่าจากนี้ไปเมื่อมีการติดตั้งแพ็กเกจ จะทำการดาวน์โหลดสิ่งต่างๆจาก Anaconda channel เพียงแหล่งเดียว
(8)
ขั้นตอนที่ 8 - คลิก Update channels
(9, 10)
ขั้นตอนที่ 9,10 - ค้นหาขณะแสดง All, ติ๊กเลือก pyspark และคลิก Apply (สังเกตว่าขั้นต่อไป Anaconda Navigator จะเปลี่ยนเวอร์ชันจาก 3.0.0 เป็น 2.4.5 เอง อาจไม่ทันสังเกต แต่กรณีนี้เป็นผลดีเพราะเวอร์ชัน 2.4.5 ตรงกับที่ต้องการจะใช้พอดี)
(11)
ขั้นตอนที่ 11 - ตรวจสอบก่อนการคลิก Apply เพื่อเริ่มการติดตั้ง pyspark 2.4.5
ไม่สามารถติดตั้ง openjdk 8.0.152
แสดงการที่ Anaconda Navigator ไม่ยอมติดตั้งเวอร์ชัน 8.0.152 ของ openjdk แต่จะติดตั้งเวอร์ชัน 11.0.6 แทน
ครั้งนี้ได้เห็นว่า Anaconda Navigator สามารถใช้ติดตั้ง pyspark 2.4.5 ได้เป็นผลสำเร็จ แต่ไม่สามารถติดตั้ง openjdk 8.0.152 ได้ เนื่องจากว่า Anaconda Navigator เปลี่ยนเป็นเวอร์ชันของ openjdk เป็น 11.0.6 เองโดยอัตโนมัติ มีอีกวิธีที่สามารถระบุเวอร์ชันได้ คือ การใช้คำสั่ง conda install แต่ต้อง Open Terminal ก่อน โปรดติดตามตอนต่อไป . . .

ดูเพิ่มเติมในซีรีส์

โฆษณา