Merge pull request #37 from NVIDIA-Jetson/alexeyk/scratch

Alexey-Kamenev · web-flow · commit ef72847a9e42 · 2018-01-17T14:37:05.000-08:00
Added support for bgr8 image encoding used in ZED camera ROS node.
diff --git a/ros/packages/caffe_ros/include/caffe_ros/tensor_net.h b/ros/packages/caffe_ros/include/caffe_ros/tensor_net.h
@@ -24,7 +24,7 @@ class TensorNet
                      ConstStr& inputBlob = "data", ConstStr& outputBlob = "prob",
                      bool useFP16 = true, bool use_cached_model = true);
 
-    void forward(const unsigned char* input, size_t w, size_t h, size_t c);
+    void forward(const unsigned char* input, size_t w, size_t h, size_t c, const std::string& encoding);
 
     int getInWidth() const    { return in_dims_.w(); }
     int getInHeight() const   { return in_dims_.h(); }
@@ -97,13 +97,14 @@ class TensorNet
     };
     static Profiler s_profiler;
 
-	nvinfer1::IRuntime*          infer_;
-	nvinfer1::ICudaEngine*       engine_;
-	nvinfer1::IExecutionContext* context_;
+    nvinfer1::IRuntime*          infer_;
+    nvinfer1::ICudaEngine*       engine_;
+    nvinfer1::IExecutionContext* context_;
     
     nvinfer1::DimsCHW in_dims_;
     nvinfer1::DimsCHW out_dims_;
 
+    // DNN input format.
     InputFormat inp_fmt_ = InputFormat::BGR;
 
     cv::Mat in_h_;
diff --git a/ros/packages/caffe_ros/src/caffe_ros.cpp b/ros/packages/caffe_ros/src/caffe_ros.cpp
@@ -110,7 +110,7 @@ sensor_msgs::Image::ConstPtr CaffeRos::computeOutputs()
         return nullptr;
 
     auto img = *cur_img_;
-    net_.forward(img.data.data(), img.width, img.height, 3);
+    net_.forward(img.data.data(), img.width, img.height, 3, img.encoding);
     auto out_msg = boost::make_shared<sensor_msgs::Image>();
     // Set stamp and frame id to the same value as source image so we can synchronize with other nodes if needed.
     out_msg->header.stamp.sec  = img.header.stamp.sec;
@@ -184,9 +184,9 @@ void CaffeRos::imageCallback(const sensor_msgs::Image::ConstPtr& msg)
     auto img = *msg;
     //ROS_DEBUG("imageCallback: %u, %u, %s", img.width, img.height, img.encoding.c_str());
     // Only RGB8 is currently supported.
-    if (img.encoding != "rgb8")
+    if (img.encoding != "rgb8" && img.encoding != "bgr8")
     {
-        ROS_FATAL("Image encoding %s is not yet supported. Supported encodings: rgb8", img.encoding.c_str());
+        ROS_FATAL("Image encoding %s is not yet supported. Supported encodings: rgb8, bgr8", img.encoding.c_str());
         ros::shutdown();
     }
     cur_img_ = msg;
diff --git a/ros/packages/caffe_ros/src/tensor_net.cpp b/ros/packages/caffe_ros/src/tensor_net.cpp
@@ -82,8 +82,8 @@ void TensorNet::profileModel(ConstStr& prototxt_path, ConstStr& model_path, bool
     if (has_fast_FP16 && !use_FP16)
         ROS_INFO("... however, the model will be loaded as FP32.");
     
-	nvinfer1::DataType model_data_type = (has_fast_FP16 && use_FP16) ? nvinfer1::DataType::kHALF : nvinfer1::DataType::kFLOAT;
-	auto blob_finder = parser->parse(prototxt_path.c_str(), model_path.c_str(), *network, model_data_type);
+    nvinfer1::DataType model_data_type = (has_fast_FP16 && use_FP16) ? nvinfer1::DataType::kHALF : nvinfer1::DataType::kFLOAT;
+    auto blob_finder = parser->parse(prototxt_path.c_str(), model_path.c_str(), *network, model_data_type);
     if (blob_finder == nullptr)
     {
         ROS_FATAL("Failed to parse network: %s, %s", prototxt_path.c_str(), model_path.c_str());
@@ -102,13 +102,13 @@ void TensorNet::profileModel(ConstStr& prototxt_path, ConstStr& model_path, bool
     // Build model.
     // REVIEW alexeyk: make configurable?
     // Note: FP16 requires batch size to be even, TensorRT will switch automatically when building an engine.
-	builder->setMaxBatchSize(1);
-	builder->setMaxWorkspaceSize(16 * 1024 * 1024);
+    builder->setMaxBatchSize(1);
+    builder->setMaxWorkspaceSize(16 * 1024 * 1024);
 
     builder->setHalf2Mode(has_fast_FP16 && use_FP16);
 
     ROS_INFO("Building CUDA engine...");
-	auto engine = builder->buildCudaEngine(*network);
+    auto engine = builder->buildCudaEngine(*network);
     if (engine == nullptr)
     {
         ROS_FATAL("Failed to build CUDA engine.");
@@ -126,8 +126,8 @@ void TensorNet::profileModel(ConstStr& prototxt_path, ConstStr& model_path, bool
     // Cleanup.
     network->destroy();
     parser->destroy();
-	engine->destroy();
-	builder->destroy();
+    engine->destroy();
+    builder->destroy();
 }
 
 void TensorNet::loadNetwork(ConstStr& prototxt_path, ConstStr& model_path,
@@ -166,14 +166,14 @@ void TensorNet::loadNetwork(ConstStr& prototxt_path, ConstStr& model_path,
     model.seekg(0, model.beg);
     const auto& model_final = model.str();
 
-	engine_ = infer_->deserializeCudaEngine(model_final.c_str(), model_final.size(), nullptr);
+    engine_ = infer_->deserializeCudaEngine(model_final.c_str(), model_final.size(), nullptr);
     if (engine_ == nullptr)
     {
         ROS_FATAL("Failed to deserialize engine.");
         ros::shutdown();
     }
 
-	context_ = engine_->createExecutionContext();
+    context_ = engine_->createExecutionContext();
     if (context_ == nullptr)
     {
         ROS_FATAL("Failed to create execution context.");
@@ -182,14 +182,14 @@ void TensorNet::loadNetwork(ConstStr& prototxt_path, ConstStr& model_path,
     ROS_INFO("Created CUDA engine and context.");
 
     int iinp = engine_->getBindingIndex(input_blob.c_str());
-	in_dims_ = DimsToCHW(engine_->getBindingDimensions(iinp));
+    in_dims_ = DimsToCHW(engine_->getBindingDimensions(iinp));
     ROS_INFO("Input : (W:%4u, H:%4u, C:%4u).", in_dims_.w(), in_dims_.h(), in_dims_.c());
     //cv::gpu::ensureSizeIsEnough(in_dims_.h(), in_dims_.w(), CV_8UC3, in_d_);
     in_d_ = cv::gpu::createContinuous(in_dims_.c(), in_dims_.w() * in_dims_.h(), CV_32FC1);
     assert(in_d_.isContinuous());
     
     int iout  = engine_->getBindingIndex(output_blob.c_str());
-	out_dims_ = DimsToCHW(engine_->getBindingDimensions(iout));
+    out_dims_ = DimsToCHW(engine_->getBindingDimensions(iout));
     ROS_INFO("Output: (W:%4u, H:%4u, C:%4u).", out_dims_.w(), out_dims_.h(), out_dims_.c());
 
     // Allocate mapped memory for the outputs.
@@ -206,8 +206,9 @@ void TensorNet::loadNetwork(ConstStr& prototxt_path, ConstStr& model_path,
     }
 }
 
-void TensorNet::forward(const unsigned char* input, size_t w, size_t h, size_t c)
+void TensorNet::forward(const unsigned char* input, size_t w, size_t h, size_t c, const std::string& encoding)
 {
+    ROS_ASSERT(encoding == "rgb8" || encoding == "bgr8");
     ROS_ASSERT(c == (size_t)in_dims_.c());
     //ROS_DEBUG("Forward: input image is (%zu, %zu, %zu), network input is (%u, %u, %u)", w, h, c, in_dims_.w(), in_dims_.h(), in_dims_.c());
 
@@ -217,9 +218,19 @@ void TensorNet::forward(const unsigned char* input, size_t w, size_t h, size_t c
     ros::Time start = ros::Time::now();
 
     in_h_ = cv::Mat((int)h, (int)w, CV_8UC3, (void*)input);
-    // Convert image from RGB to BGR format used by OpenCV if needed.
+    // Handle encodings.
     if (inp_fmt_ == InputFormat::BGR)
-        cv::cvtColor(in_h_, in_h_, CV_RGB2BGR);
+    {
+        // Convert image from RGB to BGR format used by OpenCV if needed.
+        if (encoding == "rgb8")
+            cv::cvtColor(in_h_, in_h_, CV_RGB2BGR);
+    }
+    else if (inp_fmt_ == InputFormat::RGB)
+    {
+        // Input image in OpenCV BGR, convert to RGB.
+        if (encoding == "bgr8")
+            cv::cvtColor(in_h_, in_h_, CV_BGR2RGB);
+    }
     //ROS_INFO("Dims: (%zu, %zu) -> (%zu, %zu)", w, h, (size_t)in_dims_.w(), (size_t)in_dims_.h());
     // Convert to floating point type.
     in_h_.convertTo(in_h_, CV_32F);
diff --git a/ros/packages/caffe_ros/tests/tests.cpp b/ros/packages/caffe_ros/tests/tests.cpp
@@ -26,15 +26,17 @@ class CaffeRosTestsCallback
     sensor_msgs::Image::ConstPtr dnn_out_;
 };
 
-static boost::shared_ptr<sensor_msgs::Image> readImage(const std::string& filename)
+static boost::shared_ptr<sensor_msgs::Image> readImage(const std::string& filename, const std::string& encoding = "rgb8")
 {
+    EXPECT_TRUE(encoding == "rgb8" || encoding == "bgr8");
     auto img = cv::imread(filename);
     SCOPED_TRACE(filename);
     EXPECT_TRUE(img.cols > 0 && img.rows > 0);
     // Convert image from BGR format used by OpenCV to RGB.
-    cv::cvtColor(img, img, CV_BGR2RGB);
+    if (encoding == "rgb8")
+        cv::cvtColor(img, img, CV_BGR2RGB);
     auto img_msg = boost::make_shared<sensor_msgs::Image>();
-    img_msg->encoding = "rgb8";
+    img_msg->encoding = encoding;
     img_msg->width = img.cols;
     img_msg->height = img.rows;
     img_msg->step = img_msg->width * img.channels();
@@ -88,9 +90,67 @@ TEST(CaffeRosTests, TrailNetPredictions)
         auto dnn_out = *t.dnn_out_;
         // The output should be 1x1x6 (HxWxC).
         EXPECT_EQ(dnn_out.width,  1);
-        EXPECT_EQ(dnn_out.height,  1);
+        EXPECT_EQ(dnn_out.height, 1);
         // float32, channels == 6.
-        EXPECT_EQ(dnn_out.encoding,  "32FC6");
+        EXPECT_EQ(dnn_out.encoding, "32FC6");
+        
+        auto data  = reinterpret_cast<const float*>(dnn_out.data.data());
+        for (int col = 0; col < 6; col++)
+        {
+            // Must use proper floating point comparison.
+            EXPECT_NEAR(data[col], predictions[i][col], 0.001f) << "Values are not equal at (" << i << ", " << col <<")";
+        }
+    }
+}
+
+TEST(CaffeRosTests, TrailNetPredictionsBGR8)
+{
+    ros::NodeHandle nh("~");
+    std::string test_data_dir;
+    nh.param<std::string>("test_data_dir", test_data_dir, "");
+    ASSERT_TRUE(fs::exists(test_data_dir));
+
+    CaffeRosTestsCallback t;
+    auto dnn_sub = nh.subscribe<sensor_msgs::Image>("/trails_dnn/network/output", 1,
+                                                    &CaffeRosTestsCallback::dnnCallback, &t);
+    const char* camera_topic = "/camera_trails/image_raw";
+    auto img_pub = nh.advertise<sensor_msgs::Image>(camera_topic, 1);
+
+    // Test images and expected predictions.
+    auto images            = std::vector<std::string>{"rot_l.jpg", "rot_c.jpg", "rot_r.jpg", "tran_l.jpg", "tran_r.jpg"};
+    float predictions[][6] = {{0.932, 0.060, 0.006, 0.080, 0.848, 0.071},
+                              {0.040, 0.958, 0.001, 0.488, 0.375, 0.135},
+                              {0.000, 0.027, 0.971, 0.036, 0.407, 0.555},
+                              {0.011, 0.988, 0.000, 0.981, 0.008, 0.009},
+                              {0.000, 0.855, 0.144, 0.013, 0.031, 0.954}};
+    
+    // When running using rostest, current directory is $HOME/.ros
+    fs::path data_dir{test_data_dir};
+
+    for (size_t i = 0; i < images.size(); i++)
+    {
+        auto img_msg = readImage((data_dir / images[i]).string(), "bgr8");
+        // Use image index as a unique timestamp.
+        img_msg->header.stamp.sec  = 0;
+        img_msg->header.stamp.nsec = (int)i;
+
+        ros::Rate rate(1000);
+        // Wait until DNN processes the current messages. There might be multiple messages
+        // in the queue so make sure to select the right one based on current index.
+        while (ros::ok() && (t.dnn_out_ == nullptr || t.dnn_out_->header.stamp.nsec != i))
+        {
+            img_pub.publish(img_msg);
+            ros::spinOnce();
+            rate.sleep();
+        }
+        
+        EXPECT_TRUE(t.dnn_out_ != nullptr);
+        auto dnn_out = *t.dnn_out_;
+        // The output should be 1x1x6 (HxWxC).
+        EXPECT_EQ(dnn_out.width,  1);
+        EXPECT_EQ(dnn_out.height, 1);
+        // float32, channels == 6.
+        EXPECT_EQ(dnn_out.encoding, "32FC6");
         
         auto data  = reinterpret_cast<const float*>(dnn_out.data.data());
         for (int col = 0; col < 6; col++)
@@ -146,9 +206,9 @@ TEST(CaffeRosTests, TrailNetPredictionsFP16)
         auto dnn_out = *t.dnn_out_;
         // The output should be 1x1x6 (HxWxC).
         EXPECT_EQ(dnn_out.width,  1);
-        EXPECT_EQ(dnn_out.height,  1);
+        EXPECT_EQ(dnn_out.height, 1);
         // float32, channels == 6.
-        EXPECT_EQ(dnn_out.encoding,  "32FC6");
+        EXPECT_EQ(dnn_out.encoding, "32FC6");
         
         auto data  = reinterpret_cast<const float*>(dnn_out.data.data());
         for (int col = 0; col < 6; col++)
diff --git a/ros/packages/px4_controller/launch/aion_ctl.launch b/ros/packages/px4_controller/launch/aion_ctl.launch
@@ -4,8 +4,8 @@
     <arg name="linear_speed"          default="2.0" />
     <arg name="linear_speed_scale"    default="90" />
     <arg name="turn_angle_scale"      default="-250" />
-    <arg name="dnn_turn_angle"        default="30.0" />
-    <arg name="dnn_lateralcorr_angle" default="30.0" />
+    <arg name="dnn_turn_angle"        default="15.0" />
+    <arg name="dnn_lateralcorr_angle" default="15.0" />
     <arg name="joy_type"              default="shield" />
     <arg name="log_output"            default="screen" />
 
diff --git a/ros/packages/redtail_debug/launch/trailnet_debug_zed.launch b/ros/packages/redtail_debug/launch/trailnet_debug_zed.launch
@@ -0,0 +1,30 @@
+<launch>
+    <!-- 
+    redtail debug .launch file for ZED camera which uses ZED ROS node.
+    -->
+    <arg name="prototxt_path" default="/home/nvidia/redtail/models/pretrained/TrailNet_SResNet-18.prototxt"/>
+    <arg name="model_path"    default="/home/nvidia/redtail/models/pretrained/TrailNet_SResNet-18.caffemodel" />
+    <arg name="input_layer"  default="data" />
+    <arg name="output_layer" default="out" />
+    <arg name="use_fp16"     default="true" />
+
+    <arg name="frame_id"   default="/tf_frame" />
+
+    <!-- Start ZED ROS node. -->
+    <include file="$(find zed_wrapper)/launch/zed.launch" />
+
+    <!-- Start the caffe_ros node -->
+    <node pkg="caffe_ros" type="caffe_ros_node" name="trails_dnn" output="screen">
+        <param name="camera_topic"  value="/zed/left/image_rect_color" />
+        <param name="prototxt_path" value="$(arg prototxt_path)" />
+        <param name="model_path"    value="$(arg model_path)" />
+        <param name="input_layer"   value="$(arg input_layer)" />
+        <param name="output_layer"  value="$(arg output_layer)" />
+        <param name="use_fp16"      value="$(arg use_fp16)" />
+    </node>
+
+    <node pkg="redtail_debug" type="redtail_debug_node" name="redtail_debug" output="screen">
+    </node>
+
+    <node pkg="tf" type="static_transform_publisher" name="tf_publisher" args="0 0 0 3.14 0 0 /map $(arg frame_id) 100"/>
+</launch>
diff --git a/ros/packages/redtail_debug/launch/trailnet_debug_zed_gscam.launch b/ros/packages/redtail_debug/launch/trailnet_debug_zed_gscam.launch
@@ -1,4 +1,8 @@
 <launch>
+    <!-- 
+    redtail debug .launch file for ZED camera which uses gscam node (in case ZED ROS node is not available).
+    Note that gscam will not perform image undistortion despite taking calibration YAML file as an argument.
+    -->
     <arg name="prototxt_path" default="/home/nvidia/redtail/models/pretrained/TrailNet_SResNet-18.prototxt"/>
     <arg name="model_path"    default="/home/nvidia/redtail/models/pretrained/TrailNet_SResNet-18.caffemodel" />
     <arg name="input_layer"  default="data" />
@@ -37,5 +41,5 @@
     <node pkg="redtail_debug" type="redtail_debug_node" name="redtail_debug" output="screen">
     </node>
 
-    <node name="tf_publisher" pkg="tf" type="static_transform_publisher" args="0 0 0 3.14 0 0 /map $(arg frame_id) 100"/>
+    <node pkg="tf" type="static_transform_publisher" name="tf_publisher" args="0 0 0 3.14 0 0 /map $(arg frame_id) 100"/>
 </launch>